文章梗概
近日,真迈生物联合上海交通大学医学院在国际期刊Frontiers in Genetics上发表题为“Assessing the impact of sequencing platforms and analytical pipelines on whole-exome sequencing”的研究成果。该研究采用肿瘤标准品HD832和正常样本HG001,通过NovaSeq 6000、NextSeq 550、GenoLab M,FASTASeq 300与SURFSeq 5000测序平台,采用多款主流生信软件,比较SNP和InDel在各测序平台与分析软件下的表现情况,发现测序平台对于全外显子组测序(WES)的结果影响较小,而分析软件对WES结果的影响更大。此外,也强调了生物学重复对于WES检测的重要性。
背景介绍
全外显子组测序(WES)正迅速成为识别人类基因组目标区域分子遗传病变的经济有效的工具。近年来,随着WES在遗传病和肿瘤检测领域的广泛应用,测序平台和分析软件对WES的结果的影响至关重要。
*以下为该研究成果解读
结果概要
01肿瘤样本HD832中的对比结果
首先,该研究在3个测序平台上(NovaSeq 6000, NextSeq 550, GenoLab M)通过7个分析软件获得高置信度阳性位点的检测结果,发现:软件相同时,不同测序平台之间检测到的突变数目相差很小(图1A, B)。在VarScan2分析软件下,3个平台上的平均SNP检测数分别为233、232和234。所有平台都无法检测HD832给出的全部高可信度的阳性位点,但不同分析软件得到的F Score和Recall的结果表明平台之间的差异很小,而分析软件间差异较大。例如,相同测序平台的数据在Strelka2中检测得到193个SNP位点,而在VarScan2中检测到234个。这与给出的HD832已被ddPCR验证过的阳性位点对比结果一致(图1c)。对于InDel,测序平台之间的差异仅为1-2个InDel (图1B),但分析软件之间的差异高达7个InDel。此外,SNVer和VarScan2在高置信度阳性位点的检出率上表现最好。
02正常样本HG001中的对比结果
为进一步验证肿瘤样本中的发现,又增加正常样本HG001,并纳入2个新测序平台——FASTASeq 300和SURFSeq 5000,并去除了2个肿瘤检测特异性的软件。类似地,在同一个分析软件下,不同测序平台之间SNP检测的差异较小。具体来说,在mpileup工具下,各平台SNP检测的F值范围为0.8738到0.8856。而在InDel检测中,差异更明显。例如,表现较差的SNVer分析软件的平均F值仅为0.4,而表现优越的Strelka2分析软件的平均F值高达0.76。这些发现表明:对于正常样本HG0001,测序平台的选择对WES结果的影响可以忽略不计。相反,分析软件的选择对SNP检测影响较小,但对InDel检测影响较大。
结论
1.文章通过对多个数据集的比较分析,发现对于HD832和HG001样本,分析软件对WES结果的影响大于测序平台;
2.在HD832样本中,SNVer和VarScan2在7个分析软件中表现最佳。在HG001样本的InDel检测中,Strelka2在5个分析软件中表现最佳;
3.研究为新测序平台和HD832标准样本提供了多个实用的参考数据集。通过这些参考数据集,研究人员可以选择更合适的分析软件和测序平台,从而提高遗传变异检测的准确性和可靠性。
参考文献
Sun, Yanping, et al. "Assessing the impact of sequencing platforms and analytical pipelines on whole-exome sequencing." Frontiers in Genetics 15 (2024): 1334075.
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有