您选择的条件: 杜浩
  • eDNA监测测序数据分析注释中参考数据库选择、指标阈值选择、目标数据准备的影响——以长江中游鱼类为监测目标

    分类: 生物学 >> 生态学 提交时间: 2024-01-23

    摘要: 在基于宏条形码(meta-barcoding)的eDNA监测技术路径中,eDNA测序数据的分析和注释是决定监测结果判断和评估精确与否甚至准确与否的基础,而参考数据库选择、指标阈值选择、目标数据准备是eDNA测序数据分析和注释中最为关键的3个技术环节。为弄清上述3个技术环节处理方案的影响,本研究以长江中游2组eDNA监测COI基因测序数据为分析对象,针对鱼类的检出做了3组实验来分别检验1)不同参考数据库及物种注释算法对注释结果的影响,2)不同OTU聚类序列相似度和物种注释分类置信度(序列一致性和序列覆盖度)对注释结果的影响,3)目标数据中各物种不同序列丰富度对注释结果的影响。结果显示:1)Blast算法下,3个版本nt库注释出的物种基本一致(72%~78%),2个本地序列参考库注释出的物种也基本一致(91%~96%),这5个序列参考库注释出的物种52%~68%一致;nt库RDP Classifier算法注释出的物种覆盖95%以上Blast算法注释出的物种,并比Blast算法注释出的物种多151%~443%,多出的物种大都是错误注释,本地参考数据库RDP Classifier算法注释出的物种覆盖66%~85%的Blast算法注释出的物种,并存在数条只注释到科属的结果。2)OTU聚类序列相似度阈值,取值0.999比取值0.99获得的OTU多154%~209%,注释到鱼类的OTU多240%~490%;注释分类置信度阈值(Blast算法,序列一致性和序列覆盖度)从0.8到0.99注释获得的物种组成基本(94%以上)一致,物种下的OTU组成也基本(83%以上)一致,注释分类置信度阈值取0.7时注释获得的物种组成、OTU组成和取0.8及以上时注释获得的有较大差异。3)在OTU聚类序列相似度阈值0.999、注释分类置信度阈值0.9时,多序列数据注释所得鱼类物种数、OTU数最多、物种注释正确率最高(达81.49%),分别比单序列数据的多7%、215%和高5%。在具体eDNA测序数据的分析和注释中,可通过建立完善本地参考数据库、优化OTU聚类序列相似度和物种注释分类置信度(序列一致性和序列覆盖度)取值、增加目标数据的丰富度来提高注释结果的准确性,但受制于物种注释算法的局限性,物种注释错误和注释遗漏的问题可能将长期存在,物种注释正确率通常低于85%(基于COI基因的eDNA监测)。

  • 青藏高原沙柳河流域自然径流驱动的流域生物信息流量化特征——以环境微生物为指标

    分类: 生物学 >> 生态学 提交时间: 2023-07-06

    摘要: 物质流、能量流、信息流是生态系统过程研究中的三大主题。然而,在流域生态学研究中,有关信息流的研究一直缺位。为了推动流域信息流研究,从生物信息流切入,提出流域生物信息流概念,将其定义为生物信息依托于流域生态系统过程在不同空间和系统之间进行传递、交流、作用、反馈的路径、过程与控制,并将其研究内容拟定为主要关注于水陆间、干支流间、上下游间、不同生态斑块间的流域生物信息流及其周期性节律和趋势性变迁,以及地貌、水文、人类活动等对这些生物信息流的影响等。然后,以青藏高原上青海湖重要入湖河流沙柳河的河流水体微生物和岸带土壤微生物为研究对象,利用环境DNA技术,对沙柳河流域的自然径流驱动的流域生物信息流进行量化研究。结果表明(1)岸带土壤到水体的流域生物信息流主要由地表表面流、地下潜流等驱动,并受环境过滤效应影响,其输移效率降雨天约为62.76%、晴天约为44.16%,其中输移能力降雨天约为68.49%、晴天约为56.82%,环境过滤效应降雨天约为8.38%、晴天约为22.28%;(2)水体上游到下游的流域生物信息流主要由河川径流驱动,并受衰减效应影响,其基础综合输移效率约为97.41%/km,其中径流输移能力约为99.42%/km,无效流域生物信息流占比约为43.46%,无效流域生物信息流的半衰距离约为14.52 km;(3)降雨通过增加地表表面流等的冲蚀搬运能力并削弱环境过滤效应,促使岸带土壤到水体的流域生物信息流输移能力和输移效率增大;(4)流域生物信息流的输入在一定程度上增加了输入地的可检出生物多样性,但这种增加对于流水生态系统来讲是非累积的。

  • 模拟计算平行样对流域生物信息流估算的影响

    分类: 生物学 >> 生态学 提交时间: 2023-07-06

    摘要: 流域生物信息流是流域生态学研究中的重要内容,是流域生态系统中的物质输移和能量输移过程的信息标记,是用eDNA技术调查评估河流水体中物种组成空间特征的基础。估算流域生物信息流是流域生态系统过程研究和eDNA技术调查评估河流水体中物种组成空间特征的关键。在有限的调查采样中,平行样的数量如何影响流域生物信息流的估算,尚待解答。基于抽样调查的基本原理,提出假设采样数量不影响流域生物信息流估算结果的准确度,但会影响其精密度,然后通过问题简化转化和模拟计算,对该假设进行了检验。模拟计算结果显示,随着样点生物信息检出度(平行样数量)的增大,流域生物信息流估算结果会从偏小逐渐靠近流域生物信息流实际值,同时其99.9%置信区间也逐渐集中于流域生物信息流实际值。即样点生物信息检出度(平行样数量)对流域生物信息流估算的准确度和精密度均有影响。在实际调查研究过程中,建议先在所研究区域对平行样数量和样点生物信息检出度的关系进行预评估,然后基于流域生物信息流估算可信度目标在正式实施方案中经济有效地设置平行样,基于多平行样调查结果估算流域生物信息流,再根据各样点生物信息检出状况对流域生物信息流估算结果进行后验评估。

  • 大型河流中eDNA监测结果的小尺度时空差异及重复采样建议

    分类: 生物学 >> 生态学 提交时间: 2023-07-06

    摘要: 样品重复数设计是eDNA监测技术标准化中最靠前的一个关键环节,采样中应该设置多少个样品重复先前已有研究探讨,而样品重复应该是在空间上设置系列样点,还是在时间上设置连续采样,这对于eDNA监测实践十分重要,但尚未有研究仔细探讨。针对此问题,本研究以长江武汉段为案例,通过分析不同重复采样方式所获得的eDNA监测检出的物种组成,探讨大型河流中eDNA监测的重复采样建议。结果显示,细菌和后生动物的eDNA监测空间序列样品比时间序列样品所检出的累计物种数多,所检出物种组成的空间异质性比时间异质性大,而真菌、藻类、原生动物三个细分类群相反。因此,我们建议在大型河流中,用eDNA监测环境微生物和后生动物,样品重复的设计优先关注空间重复采样;监测真菌、藻类、原生动物,样品重复的设计优先关注时间重复采样。采取空间重复采样应注意采样时间的选择,采取时间重复采样应注意采样点位的选择,针对细分类群的监测采样应注意保证样品重复数量。

  • eDNA监测方法标准化框架及未来图景

    分类: 生物学 >> 生态学 提交时间: 2023-03-28

    摘要: eDNA (environmental DNA)是指从环境样品(水体、土壤、沉积物、空气、混合物等)中提取的DNA,是各种生物的DNA混合物,区别于传统从单物种样品中提取的DNA。eDNA监测是指从环境样品中提取DNA,用物种特异性引物或特定DNA metabarcoding引物对其进行扩增测序、分类学分析、相对丰度分析、功能预测等,以监测环境中是否存在某特定物种,或者获得环境中物种组成、群落结构、生态功能等相关信息。eDNA监测主要应用在特定物种监测检出、生物多样性调查评估、群落结构和功能分析、生态系统过程分析评估等领域。eDNA监测可以应用在陆地、水体、空气、器物表面、生物(内)表面等任何有可能存在不确定DNA的场景。因为eDNA监测的非侵入性、灵敏检出、大类群检出、易标准化方法与结果、低人力物力时间成本、结果可核查等特点,未来很有希望发展成为一个常规的物种监测、群落功能预测、生态过程分析的方法,对象可涵盖所有生境条件下的所有生物类群。但要实现这个图景,需要从普遍性和特殊性层面完成eDNA监测技术链条中10个关键环节的技术标准化:样品重复数设计、采样时间设计、采样点设计、采样方法设计、样品前处理、样品保存、扩增引物选择、DNA提取-扩增-测序-分析程序、序列比对注释、监测结果后评估。目前来看,10个环节的标准化基本不存在理论上的困难,并且一部分支撑标准化的研究已经启动,甚至一部分标准化的组织工作已在推进,在未来数年内有望完成关键知识、关键数据的积累,推动eDNA监测成为长期性周期性常规生态监测内容,支撑渐行渐近的数据驱动型科学研究和生态管理。