微生物多样性扩增子测序与功能分析介绍
让白癜风患者感受中科魅力 http://pf.39.net/xwdt/161129/5061112.html 微生物多样性扩增子测序与功能分析介绍 一、技术介绍 微生物多样性扩增子测序是一种利用高通量测序技术对16S、18S、ITS等微生物特征序列进行PCR扩增并测序分析的研究方法,其中16SrDNA(即16SrRNAgene)应用较多,此方法不需要对微生物进行分离纯化培养,基于提取的总DNA即可开展丰富的微生物群落研究,在医学、工业、食品、环境科学等各领域都有十分广泛的应用。 二、实验流程 从样本中提取基因组DNA后,用带有barcode的特异引物扩增16SrDNA的V3+V4区。引物序列为:F:CCTACGGGNGGCWGCAG;R:GGACTACHVGGGTATCTAAT,将纯化后的扩增产物连接测序接头,构建测序文库,Illumina上机测序。 三、信息分析流程 微生物多样性研究主要分为物种组成分析、α多样性分析、β多样性分析、指示物种分析和功能分析,见下图。 16SrDNA测序得原始数据后,提供两种分析策略,基于Usearch软件和基于DADA2软件的分析。Usearch软件先对低质量Reads进行过滤,然后将双端Reads拼接为Tag,对Tag进行低质量过滤,得到的数据称为CleanTag,基于CleanTag,使用Usearch软件进行聚类,去除聚类过程中检测到的嵌合体Tag后获得可操作分类单元(OperationalTaxonomicUnits,OTU)丰度和OTU代表序列用于多样性分析。DADA2软件则是先使用DADA2对Reads进行过滤、校正,并输出非冗余的Reads和对应的丰度信息,然后将Reads拼接为Tag,再去除嵌合体Tag后获得用于后续分析的Tag序列和丰度,即ASV(ampliconsequencevariants)序列和ASV丰度信息。 基于测序所得OTU或ASV的序列、丰度数据,便可进行物种注释、物种组成分析、α多样性分析、β多样性分析、指示物种分析和功能分析等。若存在有效分组,则进行组间差异比较和统计检验。最后,结合其他因素(例如环境因子),进行特定的例如CCA等高级分析,以解答微生物与环境之间的关系。 1 1数据处理 测序得到原始数据后,由于PCR错误、测序错误等会产生大量的低质量数据或者无生物学意义数据(例如嵌合体),为保证后续分析具有统计可靠性和生物学有效性,我们在Reads利用、Tag拼接、OTU聚类等多个数据处理过程进行严格的质控。 2 2OTU/ASV统计 OTU:将Tag序列按相似度聚类,分成不同的序列集合(cluster),一个cluster即为1个OTU。进行聚类操作既可以提高运算效率,还可以减小测序错误的影响(相对于高丰度序列,低丰度序列出现测序错误的概率更高,cluster中选取高丰度序列作为代表,避免了低丰度序列直接参与后续分析)。 ASV:DADA2软件将输出结果称为ASV,类似于按%相似度聚类得到的OTU序列。 3 3物种组成分析 物种组成分析:对样本从门、纲、目、科、属、种多个分类学层级进行物种鉴定和注释。 展示形式:柱形图、热图、Circos图等。 ★ ★ 4 4α多样性分析 α多样性:指特定生境或者生态系统内的多样性情况,通常利用物种丰富度(种类情况)与物种均匀度(分布情况)两个重要参数来计算。主要展示observed_species(即sobs,也称为richness),Chao1,ACE,Shannon,Simpson,Pielou’sevenness(peilou),PD-wholetree和Good’sCoverage等八大类常用的α多样性指数以及它们的相关分析结果。 Sobs、Chao1、ACE指数主要关心样本的物种丰富程度,其中Sobs表示检测到的OTU个数,Chao1和ACE表示预测的OTU个数。Simpson、Shannon综合体现物种的丰富度和均匀度,故指数的高低还会受均匀度影响,样本中的物种分布越均匀,多样性越高。peilou指数指均匀度,仅反映均匀度,数值越大,越均匀。PD-wholetree指数则基于OTU序列进化树的系统发育特征,评估多样性程度,即谱系多样性。Good’sCoverage反映样本的测序饱和度; 展示形式:多样性稀释曲线、rank丰度曲线等。 ★★★ 5 5β多样性分析 β多样性:指生态系统间物种多样性的差异,可简化理解为是对样本/分组间菌群结构进行的比较,beta多样性指数与物种有无、物种丰度有关。可采用4种方法对beta多样性指数进行分析,Jaccard距离指数主要基于物种有无评估菌群结构的差异。Bray_curtis和Eucliden(PCA)基于物种有无和物种丰度。unweighted_Unifrac基于物种进化距离。weighted_unifrac基于物种进化距离和物种丰度。 基于距离指数进行PCoA、NMDS直观展示样本间菌群结构的差异程度,采用Adonis和Anosim两种检验模型,判断分组间菌群结构差异的显著性。 展示形式:散点图和盒形图等。 ★★★ 6 6指示物种分析 指示物种分析:通过对样本间、分组间的物种进行分析,找出样本间/组间潜在的biomarker,主要包括LEFse分析、随机森林分析和ROC曲线分析等。LEFse分析组间菌群差异,找出各组间(≥2组)特异的主要菌群,有助于开发biomaker等研究。随机森林分析是一种包含多个决策树的集成学习方法,在微生物多样性的研究中随机森林常被用来筛选潜在的指示物种。ROC曲线分析可用于评估物种作为biomarker的正确性,即是否能够把样本按预期分成2个分组的能力,综合考虑了物种区分能力的灵敏度和准确度。 展示形式:箱线图、饼图、气泡图和ROC曲线图等。 7 7功能分析 功能分析:是指利用生物信息学和不同表达系统对基因的功能进行的预测、鉴定和验证,主要包括PICRUSt2、Tax4Fun、Bugbase和FAPROTAX,见下表。 展示形式:柱形图、热图等。 ★★★ 参考文献 [1]LangilleMGI,ZaneveldJ,CaporasoJG,etal.Predictivefunctionalprofilingofmicrobial |
转载请注明地址:http://www.heizhongcaozia.com/hzczzzys/58755.html
- 上一篇文章: 昆明鲜花昨日对手交易行情3月6日
- 下一篇文章: 省总商会副会长阳江十八子集团公司董事长