对于一个基因,我们对其“基础属性”认识越全面,越对我们在后续进行实验和分析时提供更多的思路。

基因名字

搞清楚正确的基因名和准确使用依然是首要。之前文章讲到数据库中可能存在基因名注释明显错误,当然这只是很少情况。

由于基因命名早期没有明确的统一规范,我们会遇到一种基因有很多别名的情况。

例如节律相关基因:BMAL1 (brain and muscle ARNT-like 1) 与果蝇的CYC (cycle) 同源,也有别名 ARNTL (Aryl hydrocarbon receptor nuclear translocator-like protein)。在不同物种使用也有偏好性,如在节肢动物中更多使用CYC写法。(左图来源右图来源)节肢动物 CYC 基因
对于复杂基因名的确定,除了 NCBI 中查询,我们也可以借助 Genecardsflybasezfin 等数据库查询。当然,要还是搞不清楚,那肯定就是看看高分文献里都是怎么写的。节律基因数据库中展示
为了提高浏览器使用效率,我们也可以借助 gene-info插件,展示一些基因信息。插件展示基因信息
基因名的使用当然也包括在论文中正确书写,不同的物种的命名规范也是存在差异。这里引用《南方水产科学》公众号一篇推文内容。其他参考网址:如何正确使用基因/蛋白质的名称格式蛋白质和基因的命名规则基因命名规范

基因结构

NCBI数据库为我们查找基因信息提供了极大便利性,应该对此熟练掌握和使用。

如搜索半滑舌鳎中的pax1a基因,并进一步在Genome Data Viewer中探索详细信息,包括所在染色体(A),染色体上坐标(B),转录本信息(C),外显子信息(D)和RNA-seq数据支持的外显子覆盖度信息(E)等。也可以直接下载基因的序列。直接搜索的基因页面
当然这些在该基因的主页上也都有详细信息的展示。也能进一步下载基因上下游序列信息详细基因页面
根据基因的一些信息,也能进一步在线绘制基因结构图。详细操作参考 《组学大讲堂》公众号的一篇推文在线绘制基因结构

看文献吧

本想再絮絮叨叨写一些,感觉越写越像基因家族分析的一些内容。

我写的,肯定不如精读几篇基因家族相关的文献,可以更进一步加深对基因“基础属性”的理解。

索性就删去。

推荐两个可以在线进行基因进化分析的网站GenomicusDupScan共线性网站