r语言进行go富集分析_生信大神教你5分钟学会go富集分析及go条目关联分析!

论坛 期权论坛 编程之家     
选择匿名的用户   2021-5-31 15:16   144   0

导读

今天向大家推荐一款中科院遗传所王秀杰老师组2008年发表的在线工具GOEAST,GOEAST自发表以来一直在更新维护,并且每周与Gene Ontology网站同步GO注释数据库,保证分析结果的时效性和准确性。此外,这个数据库能够支持直接使用芯片ID进行富集,不过,我们一般都是用的genesymbol,所以就不考虑芯片ID了~~

网址:

http://omicslab.genetics.ac.cn/GOEAST/index.php

e1b4b56eb958f67be196b8369a5e7dd6.png

操作攻略

1、进入主页后,在左侧选择Tools,进入下面的界面,如果想用芯片的探针ID进行富集的,选择下面的不同的测序平台就可以了。

使用genesymbol的时候,我们点击GOEAST advance tools。

c7b29d9a5e3b5901bc50156d984f7954.png

2、点解GOEAST advance Tools后,进入下面的界面。

这里提供了三个不同的处理方式:

① 批量进行GO富集分析;

② 采用多个GOEAST分析,就是对多个实验结果进行交叉比较,不过在使用前,需要先单独获得每个分析结果

③ 定制的富集分析,这个需要自己准备背景文件等,相对比较复杂。一般对差异基因进行富集分析,我们选择第一个Batch-Genes就可以了。

点击here进入分析界面。

b5a42bb0cfdc7a97535c0ddd10204589.png

3、之后,就进入了富集分析界面。

这个数据库总共提供了58个不同的物种进行分析,包括动物,植物,真菌,细菌等不同的物种,并且支持不同的ID模式。

首先第一步选择物种。

第二步选择gene格式。

这个数据库提供了Gene ID以及Gene symbol两种种不同的格式。

我们以人的genesymbol为例,选择物种人,然后选择genesymbol。

7c7c79a4fdbf4f621451c4a914f34a57.png

4、 然后输入自己的基因序列。

比如通过芯片分析获得的差异基因的Genesymbol,或者自己上传文件。不过一般建议直接粘贴基因,因为上传文件涉及到格式问题,会比较麻烦~

1cbd22d251eb17952e0e83a38db9917e.png

5、 接下来就是选择分析方法。

矫正方法,富集p值,最终出图的格式等等。一般直接选择默认就可以了,如果有特殊的需求,可以选择let me choose,然后自己进行选择调整。

我们这里以默认设置进行分析,选择use default即可。

acbbdb1b678c2a2434296354ec1d084a.png

e0c6650738e25f335b8a8c3b18c2fc3c.png

6、接下来会要求你输入一个邮箱地址以及一个本次分析的命名~~~否则的话没有办法进行分析。

输入后点击Start analysis。

2dedf63f478c19cbda341fdcdd63784a.png

7、现在会进入一个新的页面,这个页面会告诉你基因已经被识别,并且开始分析。

分析过程数据库表示一般需要30分钟左右,这个页面也可以关闭,分析结果会直接发送到邮箱;当然,不关闭也是没问题的。

29621e905ca22a084159a170cb14cf2d.png

8、 实际上一般没有30分钟,10分钟左右就可以获得结果

所有的结果都会发送到邮箱一份,点击邮箱中的链接,就可以看到分析结果了。

64ab78e5204e93a22eac1ded37b541e7.png

9、如果之前页面没关的话,也可以直接在网页中看。

点击see result now就可以了。

7aab84160c43cc3d2268712699a27785.png

10、在结果页面,提供了一个GO富集分析的详细表格。

包裹GOID,GO的类型,条目名称,级别,p值等等信息,点击表格中的see details,还可以看到这个条目中的基因列表~~~当然,这个表格的结果也是可以下载的~~点击plain Text format就可以了。

00d40de4759870f05f0a70acb1305ca7.png

11、当然,这个网站没有这么简单。

他不仅提供了GO的富集分析结果,还提供了GO三个类型下GO条目的互作关系。

在页面的最上方,提供了BP、CC以及MF三个选项。

5aa51b4a2886ca807aae10e7326acf22.png

12、 我们以BP为例,点击Biological Process,就可以进入到下面的界面了~

看起来什么都没有对不对,其实是因为富集到的条目太多,所以这个图被压缩了,我们点击右下角的+号,把图片放大就好了。当然,由于是PDF文件,这个图也是可以下载的。

1bb205e3b91d707251010a2df129c936.png

74066871cdbc29b5730ce214e36c4dac.png

13、放大后,就可以看到BP下的GO条目的关联图了。

c01b0910870c161c6a9a96cf8b7a957d.png

14、这是一个富集分析的树形图模式。

每个放歌代表一个GO条目,连线表示它们之间的层级关系,颜色越深,表示富集越显著~~上述的树图,能反应富集的GO条目之间的层级关系,但图会较大,看着不太方便。通常会使用泡泡图来展示其中一部分最为富集的结果。

c01b0910870c161c6a9a96cf8b7a957d.png

15、圈圈图的话,就可以像之前说的那样,在结果页面点击plain Text format下载表格数据,类似于下面格式,然后选择你感兴趣的条目,一般选择排行靠前的行,然后用R语言或者在线工具绘制圈圈图就可以了。

d23a00e47d9f06bae7a92f0034d00322.png

内容来源:科研Z库

089a4c244e89cc380416a66d46e950dd.png

22de37dc095576595c15070ad48f0d31.png
木木西里科技:网状Meta分析系列文章(一):网状Meta分析背后的原理是什么zhuanlan.zhihu.com
ec73541a1ea9e9960a959d79b97c2590.png
木木西里科技:科研小白如何润色自己的 SCI 文章zhuanlan.zhihu.com
2d2a6fe192807036451d8ab9a4fa136d.png
木木西里科技:收藏:国自然基金申请书的 20 点实用建议zhuanlan.zhihu.com
2d2a6fe192807036451d8ab9a4fa136d.png

特别声明:本文发布仅仅出于传播信息需要,并不代表本公共号观点;如其他媒体、网站或个人从本公众号转载使用,请向原作者申请,并自负版权等法律责任。

分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:3875789
帖子:775174
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP