hi,我是小洁。这是我基于自己的数据分析需求写的R包,很高兴被你看到了。我会在公众号《生信星球》更新这里面一些好用的小函数,也做一些其他的分享。
if(!require(devtools))install.packages("devtools")
if(!require(AnnoProbe))devtools::install_github("jmzeng1314/AnnoProbe",upgrade = F)
if(!require(tinyarray))devtools::install_github("xjsun1221/tinyarray",upgrade = F)
点击本页面的绿色按键code
然后点击Download ZIP
,下载到你的工作目录下,用devtools::install_local("tinyarray-master.zip",upgrade = F,dependencies = T)
安装。
如果报错说xx包找不到,那就安装它。 如果报错信息中出现http,404,internet,url等关键词,说明是网络问题,一般来说本地安装即可解决。
都是字面意思:表达矩阵可视化其乐无穷。
draw_heatmap(),draw_volcano(),draw_venn(),draw_boxplot()
geo_download() : 提供geo编号,返回表达矩阵、临床信息表格和使用的平台编号。
find_anno():查找芯片平台注释
get_deg() :提供芯片表达矩阵、分组信息、探针注释,返回差异分析结果。
multi_deg() : 多个分组(最多5个)的差异分析
如果是想一步到位,做出差异分析常见的几张图,可以用get_deg_all() 和multi_deg_all()
这一部分主要是融合跟简化一下GEOquery、Annoprobe、limma的差异分析。
quick_enrich() : 简单直观的富集分析
make_tcga_group():根据TCGA的样本命名规则,快速得出分组 trans_array():替换矩阵的行名,比如把表达矩阵的探针名替换为基因名
sam_filter():去除tcga中的重复tumor样本
trans_exp():将tcga或tcga+gtex数据进行基因id转换
t_choose():批量做单个基因的t检验
cor.full()和cor.one() :批量计算基因间的相关性
dumd():统计数据框每一列各有多少个取值
point_cut():批量计算生存分析最佳截点
surv_KM():批量做KM生存分析,支持用最佳截点分组
surv_cox():批量做单因素cox,支持用最佳截点分组
exp_boxplot():给感兴趣的基因画箱线图
exp_surv():给感兴趣的基因画KM-plot
box_surv(): 给感兴趣的基因画箱线图和KM-plot
hypertest():批量做mRNA和lncRNA的超几何分布检验
plcortest():批量做mRNA和lncRNA的相关性检验
interaction_to_edges():根据关系表格生成网络图的连接表格
edges_to_nodes():根据连接表格生成节点表格
还有一个函数叫ggheat,也是字面意思,用ggplot2的函数来画热图,这个主要是为了拼图对齐和图例收集。
写于2021.1.26