您选择的条件: 刘志刚
  • eDNA监测测序数据分析注释中参考数据库选择、指标阈值选择、目标数据准备的影响——以长江中游鱼类为监测目标

    分类: 生物学 >> 生态学 提交时间: 2024-01-23

    摘要: 在基于宏条形码(meta-barcoding)的eDNA监测技术路径中,eDNA测序数据的分析和注释是决定监测结果判断和评估精确与否甚至准确与否的基础,而参考数据库选择、指标阈值选择、目标数据准备是eDNA测序数据分析和注释中最为关键的3个技术环节。为弄清上述3个技术环节处理方案的影响,本研究以长江中游2组eDNA监测COI基因测序数据为分析对象,针对鱼类的检出做了3组实验来分别检验1)不同参考数据库及物种注释算法对注释结果的影响,2)不同OTU聚类序列相似度和物种注释分类置信度(序列一致性和序列覆盖度)对注释结果的影响,3)目标数据中各物种不同序列丰富度对注释结果的影响。结果显示:1)Blast算法下,3个版本nt库注释出的物种基本一致(72%~78%),2个本地序列参考库注释出的物种也基本一致(91%~96%),这5个序列参考库注释出的物种52%~68%一致;nt库RDP Classifier算法注释出的物种覆盖95%以上Blast算法注释出的物种,并比Blast算法注释出的物种多151%~443%,多出的物种大都是错误注释,本地参考数据库RDP Classifier算法注释出的物种覆盖66%~85%的Blast算法注释出的物种,并存在数条只注释到科属的结果。2)OTU聚类序列相似度阈值,取值0.999比取值0.99获得的OTU多154%~209%,注释到鱼类的OTU多240%~490%;注释分类置信度阈值(Blast算法,序列一致性和序列覆盖度)从0.8到0.99注释获得的物种组成基本(94%以上)一致,物种下的OTU组成也基本(83%以上)一致,注释分类置信度阈值取0.7时注释获得的物种组成、OTU组成和取0.8及以上时注释获得的有较大差异。3)在OTU聚类序列相似度阈值0.999、注释分类置信度阈值0.9时,多序列数据注释所得鱼类物种数、OTU数最多、物种注释正确率最高(达81.49%),分别比单序列数据的多7%、215%和高5%。在具体eDNA测序数据的分析和注释中,可通过建立完善本地参考数据库、优化OTU聚类序列相似度和物种注释分类置信度(序列一致性和序列覆盖度)取值、增加目标数据的丰富度来提高注释结果的准确性,但受制于物种注释算法的局限性,物种注释错误和注释遗漏的问题可能将长期存在,物种注释正确率通常低于85%(基于COI基因的eDNA监测)。

  • eDNA监测空间分辨率量化的方法研究:以长江中游平水期为例

    分类: 生物学 >> 生态学 提交时间: 2023-03-28

    摘要: 长江中游是长江极为重要的自由流淌河段,为中华鲟、长江江豚等水生生物提供了关键生境,开展常态化系统化eDNA (environmental DNA)监测对域内水生生物多样性评估和保护具有重要意义。eDNA监测的空间分辨率未量化限制了长江中游常态化eDNA监测的实施。为了量化长江中游eDNA监测的空间分辨率,我们探索建立了一个基于黑箱模型、简化过程和概率化表述的量化方法。本研究2020年6月(平水期)在长江中游设置30个采样断面,断面间隔在30 km左右,开展eDNA采样,进行高通量测序(原核生物用16S rRNA基因扩增子测序、真核生物用线粒体COI基因扩增子测序),根据流域生物信息流分析框架计算eDNA所能监测到的生物信息输移的量化特征,确定eDNA监测空间分辨率(系列)值及其可信度、覆盖度。结果显示长江中游平水期eDNA所能监测到的原核生物的生物信息输移能力为99.91%/km,非生命个体生物信息输移占比23.83%,非生命个体生物信息输移半衰距离为48.45 km;真核生物的eDNA输移能力为99.85%/km,非生命个体生物信息输移占比67.93%,非生命个体生物信息输移半衰距离为30.00 km。eDNA监测空间分辨率可信度和覆盖度之间存在权衡,原核生物eDNA监测空间分辨率的可信度与覆盖度平衡点在39 km,特征值在86%左右,真核生物eDNA监测空间分辨率的可信度与覆盖度平衡点在28 km,特征值在65%左右。研究建议不同监测目的可以根据需要选择不同监测空间分辨率:以河段单元内的物种组成为目的的监测,可优先覆盖度、牺牲可信度选择eDNA监测空间分辨率;以生物多样性空间结构为目的的监测,可优先可信度、牺牲覆盖度选择eDNA监测空间分辨率。原核生物90%以上覆盖度对应的空间分辨率为27 km(可信度为84.18%),真核生物90%以上覆盖度对应的空间分辨率为6 km(可信度为41.38%),80%以上覆盖度对应的空间分辨率为13 km(可信度为50.64%);原核生物90%以上可信度对应的空间分辨率为58 km(覆盖度为82.30%),真核生物90%以上可信度对应的空间分辨率为78 km(覆盖度为38.61%),80%以上可信度对应的空间分辨率为50 km(覆盖度为49.70%)。本研究可为长江中游eDNA监测断面设置提供量化参考,为其它河流或河段eDNA监测分辨率估算提供方法借鉴。