基因家族分析

基因家族分析具体流程

Posted by CHY on July 30, 2020

本文主要介绍一些 pfam 数据库及基因家族分析相关的基础知识,便于更好的解决基因家族分析有关的问题。

基因家族是来源于同一个祖先,由一个基因通过基因重复而产生两个或更多的拷贝而构成的一组基因,它们在结构和功能上具有明显的相似性,编码相似的蛋白质产物。 pfam 介绍

如何在 pfam 中下载 hmm 文件

搜索进入到蛋白保守结构域的主页,点击右侧的 Curation&model ; 总的下载地址:ftp://ftp.ebi.ac.uk/pub/databases/Pfam/releases/ 参考链接:https://www.omicsclass.com/question/268

基因家族鉴定分析操作手册: 基因家族 基因家族鉴定 基因家族鉴定分析总结 1.下载基因组信息文件,gff,cds,pep,fasta 文件: Ensembl 下载地址:http://plants.ensembl.org/index.html 下载方法可参考:http://www.omicsclass.com/article/58 phytozome(JGI)下载地址:https://phytozome.jgi.doe.gov/pz/portal.html 下载方法可以参考:http://www.omicsclass.com/article/50 NCBI 官网下载:https://www.ncbi.nlm.nih.gov/ 下载方法可参考:http://www.omicsclass.com/article/497

2.hmmer 鉴定基因家族(拟南芥 WRKY 基因家族为例): 2.1 hmmer 搜索鉴定基因家族 如何知道自己要研究的基因家族的 pfam 号:http://www.omicsclass.com/question/268 WRKY 基因家族:Pfam 隐马尔科夫模型下载:http://pfam.xfam.org/family/PF03106 HSP20 基因家族:Pfam 隐马尔科夫模型下载:http://pfam.xfam.org/family/PF00011 Hmmer 软件官方说明文档:http://eddylab.org/software/hmmer/Userguide.pdf Hmmsearch 搜索结果说明:http://www.omicsclass.com/article/499

2.2 手动确认结构域; SMART:http://www.omicsclass.com/article/681 NCBI CDD:http://www.omicsclass.com/article/310 pfam:http://pfam.xfam.org/ 蛋白分子量分析:ExPASy (http://web.expasy.org/protparam/)

2.3. blast 鉴定基因家族分析 (适用于研究基因家族没有 PFam 号的情况)(可选分析,根据自己基因家族特点是否选择) Blastall 使用参数详细说明:http://www.omicsclass.com/article/504 Blast m8 格式输出结果说明:http://www.omicsclass.com/article/505

3.进化树分析 3.1 基因蛋白结构域构建进化树 3.2 基因蛋白全长构建进化树 Evolview 进化树美化:http://www.omicsclass.com/article/671

attachments-2019-02-RbUXm4HJ5c661bede4e37.jpg

ITOL 进化树美化:https://itol.embl.de/ itol 编辑进化树枝颜色(分组): http://www.omicsclass.com/article/448 ; 查看 node id: http://www.omicsclass.com/article/433; 添加背景颜色:http://www.omicsclass.com/article/343

4.MEME 搜索基因 motif 分析 Motif 序列信息查看:http://www.omicsclass.com/article/432 获取 motif 图片:http://www.omicsclass.com/article/67

5.基因结构分析,外显子内含子等 GSDS 网址:http://gsds.cbi.pku.edu.cn/ GSDS 绘图参考:http://www.omicsclass.com/article/63

6.基因结构+进化树+motif 绘图 TBtools 绘图参考:http://www.omicsclass.com/article/382

基因定位到染色体 MapGene2Chrom web v2 绘图:http://mg2c.iask.in/ Mapchart 绘图参考:http://www.omicsclass.com/article/397 8.mcscanX 共线性分析 1.1 基因组内共线性分析 基因组内共线性分析参考:http://www.omicsclass.com/article/275 提取基因家族串联重复脚本:http://www.omicsclass.com/article/399

2.2 基因组间共线性分析 物种之间共线性分析参考:http://www.omicsclass.com/article/284

这部分已经安装成功: 安装 python 版本的 MCScanX:https://github.com/tanghaibao/jcvi/wiki/MCscan-(Python-version) sudo /biosoft/miniconda/miniconda2/bin/pip install jcvi sudo /biosoft/miniconda/miniconda2/bin/pip install scipy

9.结合转录组分析 1.GEO 数据库: 数据下载:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE121407 绘制热图在线工具:http://www.heatmapper.ca/ meV 工具绘制热图:http://www.omicsclass.com/article/263 ;修改颜色:http://www.omicsclass.com/article/437

2.SRA 高通量二代测序数据,数据库下载数据方法,需要做转录组分析: http://www.omicsclass.com/article/53

10.基因顺势作用原件分析

Plant CARE 地址:http://bioinformatics.psb.ugent.be/webtools/plantcare/html/,这个网站的优点就是很多文章使用,可以引用 PLACE:https://sogo.dna.affrc.go.jp/cgi-bin/sogo.cgi?sid=&lang=en&pj=640&action=page&page=newplace 它的优点是每次可以输入 20 条序列,出结果的速度也比 Plant CARE 快。

提取顺势作用原件,可利用 GSDS 绘图