众筹编写《微生物组数据分析与可视化实战》——成为宏基因组学百科全书的创始人
MicrobiomeStatPlot
Interpretation and visualization of microbiome charts
高通量测序的发展极大地推动了微生物组/宏基因组领域的发展。微生物组的数据分析和解读需要微生物学、生物信息学、统计学、Shell和R语言、宏基因组学等多学科的知识,无论是中国还是世界范围内仍缺少系统的学习教材。宏基因组公众号成立的目的是打破微生物组数据分析解读的壁垒,推动本领域的发展。目前经常三年的积累,已发布数百篇本领域相关数据分析、可视化和科研经验的教程。但本领域发展迅速,很多教程需要更新,而且团队成员的知识和研究领域有限,需要更广泛的同行加入,打造宏基因组学入门百科全书,现向全球华人圈全面征集《微生物组数据分析与可视化实战》章节编写的创作者和审稿人。
创始人就是你,赶快加入贡献你的智慧吧!
创作者要求
- 本领域的专业同行,专业包括且不限于微生物学、生物信息学、微生物组学,或应用培养组学、扩增子、宏基因组、宏转录组、宏病毒组、宏蛋白组、宏代谢组、宏表观组等技术研究人类、动植物、环境的相关研究人员(年级和职称不限);
- 有专业知识搜集和整理的能力,有记录电子笔记、发表文章经历者的优先;
- 认领下方目录中章节,按照参考模板(一周内陆续发布前几节样章),采用有道云笔记markdown格式或Rmarkdown(加入后有免费培训)编写逻辑严谨、考虑读者感受、可重复性强的教程;
- 对宏基因组编辑部提出的合理意见进行认真修改;
创作者福利
- 创作者作为章节的作者之一;
- 结识宏基因组核心团队成员,见习编辑可获取编辑的基础培训;
- 发布文章三篇或过万字,可成为正式编辑,免费获得价值万元的最新扩增子、宏基因组分析流程或参加培训、会议的机会;
- 相关教程、技术文档可推荐发表SCI论文,详见:《JoVE微生物组专刊征稿,写方法拍视频教程发SCI》
- 根据贡献,获得团队发表论文、出版图书的署名权;
审稿人要求
- 专业审稿人,建议有发表文章经历,对自己擅长领域章节的逻辑、语言的全面修改和提出改进建议(同论文审稿);
- 大众审稿人,对公众号发布文章中可改进地方提出意见或建议,可通过文章下方留言、联系公众号管理员等方式沟通;
审稿人福利
- 专业审稿人可进入编辑部,作为审核文章的责任编辑,获得责编栏姓名和单位的署名权;
- 大众审稿人的姓名和单位可出现在章节的致谢部分;
- 审稿人节日福利红包!
联系宏基因组公众号
创作者和审稿人任务登记: https://kdocs.cn/l/c7CGfv9Xc 宏基因组创作者和审稿人登记表.xlsx,使用微信登陆金山文档,登记姓名、单位、研究方向、职称、负责章节具体分工等信息
联系人:刘老师
微信:meta-genomics
广告营销人员较多,添加微信务必备注姓名-单位-职位-研究方向,否则无法通过好友申请
微生物组数据分析与可视化实战——目录
以下为目前整理本领域基础知识、常用分析、必备技能的目录。部分章节有前期发布的资源和教程供参考。有自己擅长章节的作者,欢迎认领相应章节进行更新或从头创作。如果你觉得有自己擅长而且重要的知识和方法,欢迎联系我们一起讨论目录的更新。
中文的宏基因组学百科全书期待你的贡献!
序
推荐序
找在本领域积累多年的专家、学者,如朱永官院士、蓝灿辉总裁、赵方庆研究员、王军研究员、褚海燕研究员、韦中教授等对本书进行点评。
编者序
你能学到什么、近年来技术发展概述和展望。
微生物组分析(原始数据到特征表)
微生物组
微生物组的概念
发展史:摸索,初步探索,建立方法,百花齐放。
- 测序发展史,150年的风雨历程
- 一文读懂微生物组
- 有声专栏-宏基因组专业词汇—001宏基因组
- Nature综述:Microbiota, metagenome, microbiome傻傻分不清
- Microbiome:微生物组名词定义
- 群落生态学的 α-、β-、γ-多样性
- 16S测序,不知道OTU你就out了!
- 扩增子分析还聚OTU就真OUT了
- 主流非聚类方法dada2,deblur和unoise3介绍与比较
测序平台和数据
- 学习全基因组测序数据分析 1测序技术 2fasta&fastq
常用研究手段
扩增子16S
宏基因组
其他宏组学
真菌组 18S/ITS
功能基因
代谢组
基因组
转录组
有时研究也会涉及宿主、微生物的基因表达研究。更多转录组、单细胞的文章可关注生信宝典公众号。
分析前准备
生物信息
实验设计和元数据
- 微生物组取样和DNA提取建议
- 微生物常见20种培养基配方
- 微生物组学研究的那些”奇葩“动物模型
- 样品生物学重复数据选择 1必要性 2需要多少重复?
- 样品命名 注意事项 实例
- NBT:扩增子及其他测序的最小信息标准和测序规范(MIMARKS)
- NBT:未培养病毒基因组的最少信息标准(MIUViG)
- 扩增子引物选择 16S结构 16S单V4区是最佳选择? 引物评估
- 海洋可培养微生物的鉴定与分类
- 怎么取粪便样品
- 根际土Rhizosphere/Rhizoplane如何取
- Microbiome: 室温存储样本方法比较
- NBT:高通量测序16S及18S rRNA全长
- Microbiome:16S扩增子测序研究中定量变异和生物量影响
- Microbiome:扩增子检测环境样本单细胞真核生物和寄生虫的新方法
- Rob Knight: PCR不需要做三个平行再混合!
分析的基本思路
Shell和Linux
- 自学生信-biostar handbook
- Linux命令screen—终端切换,工作环境保存,画面同步,防断网
- Nature Method:Bioconda解决生物软件安装的烦恼
- 生信人值得拥有的编程模板-Shell
- 生信人值得拥有的编程模板-Perl
- 手把手教你生信分析平台搭建
- Windows轻松实现linux shell环境:gitforwindows
- 开启win10内置Linux子程序
- Docker的基本使用-Ubuntu18.04
- linux 极简统计分析工具 datamash
- csvtk:高效命令行版极简dplyr
- 文件批量重命名的技术,你值得拥有
- 耗时很长的程序忘加nohup就运行了怎么办?
R统计与绘图
R语言基础
- 图之典—可视化图表的词典
- 编程模板-R语言脚本写作:最简单的统计与绘图,包安装、命令行参数解析、文件读取、表格和矢量图输出
- R语言统计入门课程推荐——生物科学中的数据分析Data Analysis for the Life Sciences
- 数据可视化基本套路总结
- R图转成Word、PPT、Excel、HTML、Latex、矢量图等
- 你知道R中的赋值符号箭头
<-
和等号=
的区别吗? - 使用dplyr进行数据操作30例
- 交集intersect、并集union、找不同setdiff
- R包reshape2,轻松实现长、宽数据表格转换
- 1数据类型(向量、数组、矩阵、 列表和数据框)
- 2读写数据所需的主要函数、与外部环境交互
- 3数据筛选——提取对象的子集
- 4向量、矩阵的数学运算
- 5控制结构
- 6函数及作用域
- 7认识循环函数lapply和sapply
- 8分解数据框split和查看对象str
- 9模拟—随机数、抽样、线性模型
ggplot2绘图基础
- ggplot2高效实用指南 (可视化脚本、工具、套路、配色)
- ggplot2地理信息可视化 上 下
- 1初识ggplot2绘制几何对象
- 2图层的使用—基础、加标签、注释
- 3工具箱—误差线、加权数、展示数据分布
- 4语法基础
- 5通过图层构建图像
- 6标度、轴和图例
- 7定位-分面和坐标系
- 8主题设置、存储导出
- 9绘图需要的数据整理技术
- ggThemeAssist:鼠标调整ggplot2主题,不用再记这些代码啦!
- 不需要懂得编程,但却可以使用ggplot2画出论文级别的图?esquisse
- ggplot版本的华夫饼图吧
R语言绘图专辑
高级统计绘图
- 50个ggplot2可视化案例
- R语言大会:宏基因组数据分析和可视化套路总结
- 28个实用绘图包,总有几个适合你
- 热图绘制
- 获取pheatmap聚类后和标准化后的结果
- R做线性回归
- 绘图相关系数矩阵corrplot
- 相关矩阵可视化ggcorrplot
- 绘制交互式图形recharts
- 交互式可视化CanvasXpress
- 聚类分析factoextra
- LDA分析、作图及添加置信-ggord
- 解决散点图样品标签重叠ggrepel
- 添加P值或显著性标记ggpubr
- R语言一键批量完成差异统计和可视化
- Alpha多样性稀释曲线rarefraction curve
- 堆叠柱状图各成分连线画法:突出组间变化
- 冲击图展示组间时间序列变化ggalluvial
- 桑基图riverplot
- 微生物环境因子分析ggvegan
- 五彩进化树与热图更配ggtree
- 多元回归树分析mvpart
- 随机森林randomForest 分类Classification 回归Regression
- 加权基因共表达网络分析WGCNA
- SPIEC-EASI的微生物网络构建示例
- circlize包绘制circos-plot
- R语言搭建炫酷的线上博客系统
- 使用ComplexHeatmap包绘制个性化热图
- R包circlize:柱状图用腻了?试试好看的弦状图
- Science组合图表解读:相关corrplot+环境因子连线
- gganimate绘制动图观察连续变化数据
- Pathview包:整合表达谱数据可视化KEGG通路
- ggcor:相关系数矩阵Science级组合图表
- ggridges包:时间动态波涛汹涌图
- 地图 世界 中国
- 手把手重现Science的主图Maptree
- 基于R的混合线性模型的实现
- 普鲁克分析(Procrustes Analysis)评估物种-环境/功能关联度的一个示例
- R语言绘制带聚类树的堆叠柱形图
常用分析流程
盘点主流软件。高级阶段应该是各种方法步骤的自由组合,甚至是根据需要设计、开发方法。
扩增子
64, 33格式转换
USEARCH/VSEARCH
- 扩增子分析神器USEARCH 简介 v11新功能 v11命令大全 OTU表抽平otutab_rare 核心OTU鉴定otutab_core
- 扩增子分析神器VSEARCH 分析流程 2.8.1中文帮助文档
QIIME 2
- NBT:QIIME 2可重复、交互式的微生物组分析平台
- 1简介和安装Introduction&Install
- 2插件工作流程概述Workflow
- 3老司机上路指南Experienced
- 4人体各部位微生物组分析Moving Pictures
- Genome Biology:人体各部位微生物组时间序列分析
- 5粪菌移植分析练习FMT
- Microbiome:粪菌移植改善自闭症
- 6沙漠土壤分析Atacama soil
- mSystems:干旱对土壤微生物组的影响
- 7帕金森小鼠教程Parkinson's Mouse
- Cell:肠道菌群促进帕金森发生ParkinsonDisease
- 8差异丰度分析gneiss
- 9数据导入Importing data
- 10数据导出Exporting data
- 11元数据Metadata
- 12数据筛选Filtering data
- 13训练特征分类器Training feature classifiers
- 14数据评估和质控Evaluating and controlling
- 15样品分类和回归q2-sample-classifier
- 16纵向和成对样本比较q2-longitudinal
- 17鉴定和过滤嵌合体序列q2-vsearch
- 18序列双端合并read-joining
- 19使用q2-vsearch聚类OTUs
- 20实用程序Utilities
- 21进化树推断q2-phylogeny
- 22命令行界面q2cli
- 23图形界面q2studio
- 24Python命令行模式Artifact API
- 25可用和开发中插件AvailableFuturePlugins
- 26开发新插件DevelopingPlugin
- 27语义类型Semantic
- 28社区Community
- 29参考数据库DataResources
- 30补充资源SupplementaryResources
- 31名词Glossary
- 32如何写方法和引用Citing
- 国内网络环境优化qiime2安装过程-QIIME 2安装慢或无法下载的解决方案
- ANCOM:找出微生物群落中的差异物种
宏基因组
有参分析Read-based
- MetaPhlAn2基于多标记基因的宏基因组物种组成定量 文章解读 软件使用
- HUMAnN2基于UniRef数据库的功能定量 1文章解读 2软件教程 3有参分析流程
- Kraken:使用精确比对的超快速宏基因组序列分类软件 宏基因组序列物种分类之kraken 1/2和Bracken的使用
- 宏基因组注释和可视化神器MEGAN入门
无参Assembly-based
- 1背景知识-Shell入门与本地blast实战
- 2数据质控fastqc, Trimmomatic, MultiQC, khmer
- 3组装拼接MEGAHIT(多快好省)和评估quast
- MEGAHIT:通过简洁的de Bruijn图为超大型复杂宏基因组拼接的超快速单节点解决方案
- metaSPAdes:新型多功能宏基因组拼接工具
- IDBA-UD:组装非均匀覆盖度的宏基因组和单细胞数据
- MetaQuast:评估宏基因组拼接
- 4基因注释Prokka Prokka:快速原核基因组、宏基因组基因注释 Prodigal:原核基因识别和翻译起始位点鉴定 metaProdigal:宏基因组序列中的基因和翻译起始位点预测
- 5基于Kmer比较数据集sourmash
- 6不比对快速估计基因丰度Salmon Salmon不比对快速宏基因组基因定量
- 7bwa序列比对, samtools查看, bedtools丰度统计
- 8分箱宏基因组binning, MaxBin, MetaBin, VizBin
- 9组装assembly和分箱bin结果可视化—Anvi'o
- 10绘制圈图-Circos安装与使用
功能注释数据库
- KEGG在线数据库使用攻略
- KEGG功能注释工具 KofamKOALA 安装与使用
- NAR-2018-dbCAN2鉴定宏基因组CAZYome碳水化合物相关基因
- EggNOG功能注释数据库在线和本地使用 eggNOG 5数据库介绍
- antiSMASH:微生物次生代谢物基因簇预测
- NAR:antiSMASH数据库2—次级代谢物基因簇预测
- 抗生素抗性基因研究进展PPT分享
- Briefings in Bioinformatics:微生物基因组学和功能基因组学相关软件和数据库的研究进展
- WebMGA:超快的基因组序列聚类注释在线工具
分箱专题
- Microbiome:宏基因组分箱流程MetaWRAP 简介 安装和数据库部署 实战和结果解读
- NBT:宏基因组"读云"10X建库+雅典娜算法组装获得微生物高质量基因组
- DAS工具: 利用去重、聚合和评分的策略从宏基因组中恢复基因组
- 一文读懂宏基因组binning
- 微生物基因组分类数据库GTDB和软件GTDB-Tk
认识特征表 Feature table
特征表是上游大数据分析的终点,是里程碑式的成果,同时也是下游分析的起始。
特征表的分析、可视化和解读
- 扩增子图表解读-理解文章思路
- 扩增子分析流程-把握分析细节
- 扩增子统计绘图-冲击高分文章
- 微生物16S测序数据的正确打开方式
- 多快好省的宏基因组研究技巧
- 如何读懂和利用你的微生物多样性测序结果?
- 水稻微生物组时间序列分析 1模式图与PCoA 2a相关分析 2b散点图拟合 3冲击图 4随机森林回归
- 微生物组统计和可视化——phyloseq入门
Alpha多样性
箱线图或柱状图
稀释曲线
维恩图
维恩图的变形,如UpsetView,网络图等。
Beta多样性
非限制性排序PCoA/NMDS
- 主成分分析PCA
- 主坐标分析PCoA
- 非度量多维尺度分析NMDS
- 对应分析CA
- 其他排序pls-da,opls-da,t-sne
统计方法PERMANOVA
- PERMANOVA
- ANOSIM
- MRPP
限制性排序
- 限制性主坐标分析Constrinaed PCoA
- 冗余分析RDA
- 典范对应分析CCA
- LDA
物种组成
堆叠柱状图
弦图
树图/气泡图
差异比较
t检验和秩和检验
负二项分布和计数型差异分析edgeR/DESeq2
- 什么是物种数据的过度离散现象和负二项分布
- 用edgeR包进行差异分析
- DESeq2包进行差异分析
STAMP与扩展柱状图
LEfSe和Cladogram
其他常用差异分析方法
- ANCOM分析
- ALDEx2分析
- songbird和DEICODE介绍
- limma
网络分析
网络基础知识
可视化入门
- 按分类或模块着色网络
- 网络属性
- 全局属性
- 节点属性
- 网络图在R中的实现-igraph
- 微生物网络构建:MENA, LSA, SparCC和CoNet
- SparCC的微生物网络构建示例
- Cytoscape: MCODE包实现网络模块化分析 GIANT包分析网络的Z、P-score 制作带bar和pie节点的网络图
- 使用网络图展示Venn图集合及Cytoscape操作视频
可视化进阶
- 双网络比对
- 多网络时间序列
- Gephi美化
机器学习
机器学习的常用算法
随机森林分类
黄适:这个RandomForest package 非常慢,已经完全不适应大数据分析需求。推荐使用ranger https://github.com/imbs-hl/ranger
- 分类
- 分类评估-ROC曲线及DCA分析
随机森林回归
- 回归
- 回归及效果评价
Adaboost/slime2
深度学习
来源追溯SourceTracker/FEAST
其他常用算法
- 人工神经网络分类
- 支持向量机分类
- 逻辑回归(GLM)
树形图
进化树构建
- 多序列比对
- 建树Fastree/RaxL
- 宏基因组中建树Phylophlan3
- iTOL美化进化树
- ggtree美化进化树
分类树构建
- Graphlan与Cladogram
- Krona
- Metacoder
相关分析
特征与环境因子相关
特征间相关(同网络)
相关分析的可视化
统计学基础
正态性检验和方差齐性分析
t检验、方差分析、卡方检验使用注意事项
两组和多组秩和检验
多重比较的P值校正
物种数据标准化方法和注意事项
文章套路总结
扩增子
宏基因组
参考基因集
碳水化合物
抗生素抗性
扩增子+宏基因组
其他研究热点
- 人类:肠型、肥胖、二型糖尿病、IBD、早产、关联分析
- 动物:无菌小鼠、牛瘤胃、食性、宿主和微生物共进化
- 植物:根际、叶际、代谢物、氮利用、抗病
- 环境:抗生素耐药、抗生素挖掘、极端环境、生命之树
附录
实验设计
实验方案,样本元数据收集,样本名命名规则和示例。
测序平台和测序技术
数据备份与发布
NCBI,GSA,EBI
图片排版和美化
杂志点评
CNS,Microbiome,ISME
相关文章按杂志分类
论文写作、投稿和文献整理
机遇与挑战
目前的优缺点和不足,未来的发展方向。
三代测序
NBT的PacBio和ONT文章简介
- 一文读懂Nanopore测序技术的发展及应用
- NBT:牛瘤胃微生物组的参考基因组集
- NBT:宏基因组二、三代混合组装软件OPERA-MS
- NBT封面:纳米孔宏基因组6小时识别下呼吸道病原体
- 纳米孔测序揭示冻土冻融对土壤微生物群落变化的影响
- 2019新型冠状病毒Nanopore测序标准操作流程
- Medicine in Microecology:微生物所王军组发表Nanopore三代测序人类肠道病毒组的方法
- 高分文章精选 | 纳米孔宏基因组测序的表现
经验和资源推荐
经验
办工效率
书籍专著
国外教程
- 2016加拿大宏基因组分析教程
- 1简介-定义、方法和数据库
- 2扩增子-微生物群落多样性
- 3PICRUSt功能预测
- 4宏基因组物种组成和分箱
- 5宏基因组功能数据库与通路
- 6宏转录组流程和功能
- 7挖掘微生物组生物标记
- 4500元的微生物组培训资料
- 微生物组助手——最易学的扩增子、宏基因组分析流程
- GigaScience:ASaiM基于Galaxy微生物组分析框架
- 斯坦福大学统计系教授带你玩转微生物组分析
- 30余款宏基因组分析软件经验总结上 中 下
- 微生物组学数据分析工具综述 | 16S+宏基因组+宏病毒组+宏转录组
宏基因组精品文章(专题)
本书主要参考文献全文解读
网站数据库
- 微生物组网页工具MicrobiomeAnalyst——教你零基础开展微生物组数据分析和可视化 Nature子刊:官网教程中文版、 实操教程、 NAR:原文解读
- NAR:gcMeta——全球微生物组数据存储和标准化分析平台
- NAR:rrnDB-16S拷贝数校正数据库
- METAGENassist帮你搞定宏基因组分析的图形需求
- SILVAngs:16S/18S在线分析1 2
- 微生物组数据库(http://egcloud.cib.cn)正式上线
- 微生物扩增子数据库大全
- NAR:UNITE真菌鉴定ITS数据库
- curatedMD包挖掘宏基因组公共数据库
软件算法和流程
- MIMOSA2: 基于微生物组和代谢组数据的整合分析
- Nature Protocols:整合宏基因组、代谢组和表型分析的的计算框架
- Nmeth:DEMIC——使用宏基因组数据预测细菌的生长速率
- Nature Method :Striped UniFrac算法分析微生物组大数据
- 青岛能源所提出微生物组相似度新算法DMS
方法评测
培养组
肠型
基金
人物传记
参考基因(组)集
- Cell:Tara2.0基因表达的改变和群落的更替塑造了全球海洋宏转录组
- Nature:基于宏基因组测序构建人类肠道微生物组参考基因集
- NBT:人类微生物组千万基因的参考基因集
- NC:全球柑橘根际微生物组的结构和功能
- Cell子刊:人类微生物组参考基因集中的单体基因
病毒组
猜你喜欢
- 10000+: 菌群分析
宝宝与猫狗 提DNA发Nature 实验分析谁对结果影响大 Cell微生物专刊 肠道指挥大脑 - 系列教程:微生物组入门 Biostar 微生物组 宏基因组
- 专业技能:生信宝典 学术图表 高分文章 不可或缺的人
- 一文读懂:宏基因组 寄生虫益处 进化树
- 必备技能:提问 搜索 Endnote
- 文献阅读 热心肠 SemanticScholar Geenmedical
- 扩增子分析:图表解读 分析流程 统计绘图
- 16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
- 在线工具:16S预测培养基 生信绘图
- 科研经验:云笔记 云协作 公众号
- 编程模板: Shell R Perl
- 生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘
写在后面
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。
点击阅读原文,跳转最新文章目录阅读 https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA