查看原文
其他

啥?基因还有“假”的!然后5分的SCI就这么到手啦!?

楼威洋 弗雷赛斯 2019-11-29

不晓得假基因是什么?


且听小编细细道来:假基因,也称伪基因,是基因进化过程中的不具有编码功能的残留物。它是最早在研究非洲爪蟾过程中发现的。它与正常基因非常相似,但不具有正常基因的功能。近年来研究发现,假基因的异常调节会导致多种疾病的发生和进展,这其中就包括了恶性肿瘤。假基因转录形成的RNA也是非编码RNA中的一种。非编码RNA中其他成员(miRNA, lncRNA, circRNA)研究颇多,看样子假基因接下来或许也要火,哈哈哈…


言归正传,今天给大家介绍一篇假基因方面的生信分析类的文章。


Title: <Integrated analysis of pseudogene RP11-564d11.3expression and its potential roles in hepatocellular carcinoma>


Journal: Epigenomics (IF=5.0, JCR2区)


思路剖析:

1.先找到在肺癌、胃癌、肝癌中差异表达的假基因,并作交集分析。(为什么选这三种癌?答:在中国,这三种癌的发病率和死亡率都较高,因此先用这三种癌做初步筛选)。

找到42个上调和2个下调(tumor vs. normal)

2.接着作者又在其他29种癌症进一步验证这些初步筛选的假基因的表达情况,

发现只有16个假基因是与之前三种癌症的分析结果比较符合的,并做了相应的热图。这16个假基因做进一步分析

3.对16个假基因做生存分析(用了之前我推文种讲的GEPIA数据库,分析流畅便捷)

红色代表预后差,绿色代表预后好,黄色(你懂的,中间)。每个框中的数字代表P值,P<0.05代表具有统计学意义。作者发现假基因RP11-564D11.3在7种癌种都提示预后差。综合表达和预后的分析结果,作者推测假基因RP11-564D11.3可能在发生和进展中更具有作为促癌基因的可能性。再往下的分析,作者主要研究这个假基因。

4.构建假基因-miRNA-mRNA调控网络

假基因也是非编码RNA中的一种,它也可以和lncRNA和circRNA一样改变miRNA丰度,从而参与下游基因的调节(ceRNA机制,大家可以去看看这篇文献作进一步了解<A ceRNAhypothesis: the Rosetta Stone of a hidden RNA language>)。

这里作者用starBase v2.0预测可以结合假基因RP11-564D11.3的miRNA,然后又用miRTarBase预测了miRNA下游的靶基因,然后在CytoScape软件构建了相应的网络图。

5.随后,对miRNA的假基因作功能注释和通路富集分析。

作者发现这些基因富集在肝癌、肺癌和肾细胞癌相关的通路上。有趣的是,之前对假基因RP11-564D11.3生存分析的结果显示在这三种癌症中它都提示不良预后并具有统计学意义。因此,假基因RP11-564D11.3的上调可能参与了肝癌、肺癌和肾细胞癌的发生和进展。

6.进一步对这些靶基因作蛋白互作网络分析,并根据node degree筛选其中的枢纽基因。

7.对排在前十的枢纽基因做进一步的分析。

根据ceRNA假说,假基因RP11-564D11.3与这些下游基因之间应该是正相关的。因此,作者首先评估了假基因RP11-564D11.3和前十个枢纽基因在肝癌、肺癌和肾细胞癌中的相关性。如下:

发现在肝癌中,10个枢纽基因中的6个枢纽基因和假基因RP11-564D11.3都具有显著正相关,肺癌中只有3个,而肾细胞癌中只有1个。因此,作者认为,假基因RP11-564D11.3作为肝癌的预后指标中可能具有更大的潜能。

那到底假基因RP11-564D11.3是通过调节哪个枢纽基因发挥作用的呢?同样,正相关的两个基因,在预后作用应该也具有一致性。因此,接下来,作者又对这十个枢纽基因在肝癌中的预后作用做了相应的分析,如下:

最后发现,只有VEGFA提示预后不良且具有统计学意义。并对VEGFA的mRNA水平(用了之前我推文中提及的UALCAN数据库)和蛋白水平(HPA数据库)的表达情况也做了分析,发现在肿瘤中显著高表达。

截止到这,作者得出结论:VEGFA是假基因RP11-564D11.3下游的一个靶点。整篇文章到这,全部结束。

这篇文章的分析完全是零代码的,并且零实验,就是简单地利用了一些在线数据库,讲了一个完整的故事,最后发表在5分的二区期刊中。除了这篇文章中所用的数据库和分析方法,还有很多其他的在线分析数据库和小工具,通过整合它们的分析结果,完全可以发表SCI文章。如果逻辑得当的话,4-5分的文章也不是不可能。


为了方便大家的学习,我已经录制了一套视频教程《零基础,零代码发表4分生信SCI文章》,可供大家学习,里面不仅包含了这篇文章的所有数据库和分析方法:包括差异基因怎么筛选,数据库怎么选择,枢纽基因又怎么筛选等等。此外,视频教程中还还原了一篇我自己已经发表的SCI文章(IF=4.2)。可以放心,视频完全零代码,零基础的同学可以轻松上手。原价599元,现在特价99元,活动仅剩最后几天,时间截止后涨价,有需要的同学可以点击“阅读原文”学习。


初学的同学,也可以到目前国内最大的生信学习社区(https://shengxin.ren/)逛逛,尤其是神秘的SangerBox可视化生信分析软件。


科学自由共享

投稿请扔至:freescience@zju.edu.cn

未经许可 不得转载

长按二维码关注

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存