r语言绘制go富集图 r语言做go富集

R语言可视化及作图7--ggplot2之标签、图例和标题绘制

R语言绘图系列：

我们提供的服务有：成都网站建设、网站设计、微信公众号开发、网站优化、网站认证、五峰ssl等。为近1000家企事业单位解决了网站和推广的问题。提供周到的售前咨询和贴心的售后服务，是有科学管理、有技术的五峰网站制作公司

使用geom_label绘制标签散点图

绘制点，并通过nudge参数对标签进行x轴和y轴上的平移

使用angle参数对标签角度进行设置

geom_label可以使用fill对颜色进行填充,fontface设置字体，geom_text不能填充颜色

parse参数意思是前面传入的是一个数学表达毕州式，size定义标签相对大小。

画一瞎基个散点图

annotate函数传入标签

添加矩形

添加短线段

2.1 guide_legend函数（主要参磨数谨数：color, shape, size）

图例调整函数也属于标度函数的一类，但不可以直接使用加号来连接，必须放在函数中，作为一个参数。

guide_colorbar和guide_legend设置的是不同的图例，guide_colorbar定义色条图例，guide_legend定义普通图例。

2.2 标度函数scale

对于连续型变量，使用的参数是scale_xxx_continous()，对于分类型变量，使用的是scale_xxx_discrete()。

2.3：theme函数

在theme函数中，与图例有关的主要参数有：

标题主要有五种：主标题，副标题，角注，x轴标签和y轴标签

ggtitle()只能定义标题和副标题，默认的位置在左上角。

r语言怎么查看富集分析的数据

r语言怎么查看富集分迅汪析的数据

1.首先利用r语言的install中的packages方法,输入参数【xlsx】即可。

2.此时利用library(xlsx)语句,打开xlsx这个库。

3.此时通过read的xlsx语法就能读取某个文件夹拍昌橘下的Excel文件。

4.这个时候,我们按下回车,就袭团能看到通过r语言读取excel的一批数据。

「GO富集分析」从原理到实践 ~ 零基础掌握

原本，我并无写这一稿件的想法。主要原因有二：

如果要找合理解释，那么针对第一点，就是每天仍然有大量新接触生信数据分析的朋友；针对第二点，......在前两颂亮指天我推的文稿《零基础快速完成基因功能注释 / GO / KEGG / PFAM...》中，评论区答应了下，阅读过5000，那就写一写富集分析。于是，如果不写，总是不对。如果要写，只能现在写。毕竟有些事情，现在不做，以后真的不会做。

对于这一块，完全陌生的朋友，尤其是不少生物学背景朋友，有必要温习一下数理统计基础。这一稿件只做原理最简单的但使用最广泛其速度最快的Over-Represence Analysis模式的富集分析讲演。其他模式，不涉及。

回键拍到主题，先举个经典的抽球例子：

小红小绿小蓝三个人自称有超能力，可以用手摸摸球就分辨出黑球白球，于是我们找来黑袋子，放100个球，其中20个白球80个黑球，让三人分别无放回地抽取。

小红随机抽出来10个球，其中2个白球8个黑球，情况即，

抽球中白球比例与背景白球比例完全一致，说明小红抽球结果随机。

球放回去，小绿来抽球，抽出来的10个球，其中3个白球7个黑球，情况即，

这是经典的抽球案例，抽取到的白球个数的概率分布为超几何分布。基于此，我们可以简单计算抽取到比小绿抽取到球个数（或更多即更极端）的概率如何，在 R语言中计算，即

而对于小蓝的情况，那么概率如何？

在 TBtools 中也可以计算，只是写法有点区别

可以看到，尽管这只是一次抽球，小绿抽球中白球比例（或更极端情况）出现的概率是31.88%+，还是挺高的，于是我们有较高的把握说，小绿嘛，只是走了狗屎运。相反，小蓝抽球中白球比例或更极端情况出现的概率几乎为 0 ，我们几乎没啥把握说，小蓝走狗屎运....换句话说，我们有理由相信，或许小蓝真有抽白野配球的超能力.....

说了这么多，那么跟基因集合富集分析有啥关系？....基因集合功能富集分析。那么我们就需要有一个基因集合（如差异表达基因集合或ChIP-seq的Peaks或GWAS定位的系列区间），还有一个功能标签（如生长素信号转导相关）。于是黑白球案例可以简单调整一下。假定现在这个物种一共有100个基因，其中20个基因与生长素信号转导相关，80个没有注释到与生长素信号转导相关（换句话说，约等于无关），我们做了对植株做了处理，和CK分别测定转录表达谱，通过差异表达分析，鉴定到10个差异表达基因，其中2个与生长素信号转导相关，而另外8个则没注释到生长素信号转导相关，简单画一下，即

好，剩下的两个就不替换了。整体上，ORA模式的富集分析，本身就是经典的抽球案例，感兴趣的自行替换就可以了。

基本原理，相信都搞清楚了。不过还是有两三点需要注意：

具体如何做物种所有基因的背景注释，请参考前述推文《零基础快速完成基因功能注释 / GO / KEGG / PFAM...》。

首先，打开 TBtools GO 富集分析界面

整体如上，一共三个文件：

具体示例如下

点击 Start ，随后等待即可。完成时会有弹窗提示。查看输出文件

（写到这里，突然觉得这些都没啥意思，不知为何....就不详细写了，大伙自己看看列名，猜猜吧）

很多时候，我们会选择，筛选第一列，只看 Biological Process。一般这些与我们的生物学认知会贴近一些。

基因集合功能富集分析，是一个常常被谈起的话题，甚至近期都有不少新方法或算法被提出。感兴趣的朋友可以去了解。这份教程，只与大伙说最简单，但也是使用最为广泛的一种富集分析模式。无论是不是 TBtools 用户，理论上来说，都可以轻松理解并掌握，从原理到实践。

写到一半，其实我已经不想写了。原因非常简单，这也是为什么在我之前，并没有一个人写出来 TBtools 类似的工具。不是写不了，而是不想写。有时候，随着能力增长和知识积累，往往不再愿意做一些简单的事情。或许这还涉及到年龄的增长，角色的转变，责任的变化....云云。

小时候，我以为写 TBtools 玩玩；

后来，我以为我会一直写下去；

现在，，，，，，

文章题目：r语言绘制go富集图 r语言做go富集
新闻来源：http://cdweb.net/article/dcpishp.html

NEWS

网站建设资讯

r语言绘制go富集图 r语言做go富集

R语言可视化及作图7--ggplot2之标签、图例和标题绘制

r语言怎么查看富集分析的数据

「GO富集分析」从原理到实践 ~ 零基础掌握

其他资讯