港媒:中国科学家打造全球最精细人类基因组,对治病大有益处

港媒:中国科学家打造全球最精细人类基因组,对治病大有益处
2024年02月03日 15:03 天机调茶局

近日,据香港知名国际媒体《南华早报》消息称,中国科学家构建了世界上最详细的人类基因组

香港观察人士认为这是一个“里程碑式的事件”,可能对疾病治疗的精准医疗有巨大的影响。这个完整、高质量的基因组是从一位来自中国陕西省的“健康年轻”男性村民的DNA中测序的,也是第一个完整的汉族基因组,被称为T2T-YAO。

通过将患者的遗传数据与参考基因组进行比较,医疗提供者可以根据个体的遗传构成和特定的疾病风险制定个性化的治疗方案。

T2T-YAO也可以帮助我们更好地理解遗传和表型特征的疾病,特别是在中国人群的独特变异的背景下。

什么是人类基因组?

人类基因组是指人类细胞中的所有遗传信息,包括DNA和RNA。DNA是由四种碱基(A、T、C、G)组成的双链分子,RNA是由四种碱基(A、U、C、G)组成的单链分子。

DNA和RNA中的碱基序列决定了人类的遗传特征,如眼睛的颜色、血型、性别等。

人类基因组中的DNA分布在23对染色体上,其中一对是性染色体,决定了性别。

男性的性染色体是XY,女性的性染色体是XX。

每个染色体上有数千个基因,基因是DNA的一段特定区域,编码了一种或多种蛋白质。蛋白质是人体的重要组成部分,参与了许多生命活动,如代谢、免疫、信号传导等。

人类基因组中的RNA主要有三种类型,分别是mRNA、tRNA和rRNA。mRNA是信使RNA,负责将DNA中的遗传信息转录成蛋白质。

tRNA是转运RNA,负责将氨基酸运送到蛋白质合成的地方。rRNA是核糖体RNA,负责构成核糖体,参与蛋白质的合成。

人类基因组的大小约为3.2亿个碱基对,相当于一本3000页的书。

人类基因组中的99.9%的碱基序列是相同的,只有0.1%的碱基序列是不同的,这些不同的碱基序列造成了人类之间的个体差异,也是研究人类遗传病和药物反应的重要依据。

为什么要测序人类基因组?

测序人类基因组的目的是为了揭示人类的遗传密码,了解人类的起源、进化、健康和疾病。通过测序人类基因组,我们可以发现人类基因组中的变异,如单核苷酸多态性(SNP)、拷贝数变异(CNV)、插入缺失(INDEL)等,这些变异可能与人类的性状、表型、疾病风险、药物反应等有关。

通过分析人类基因组的变异,我们可以为个体提供更精准的诊断、预防、治疗和预后,实现精准医疗的目标。

测序人类基因组还可以帮助我们探索人类的历史,追溯人类的起源、迁徙、混合和适应。

通过比较不同人群、不同地域、不同时间的人类基因组,我们可以重建人类的谱系树,揭示人类的亲缘关系,发现人类的共同祖先,以及人类与其他物种的进化关系。

我们还可以发现人类基因组中的选择信号,反映了人类在不同的环境和压力下的适应性变化。

测序人类基因组也可以促进人类的创新,为生物技术、生物医药、生物信息学等领域提供新的思路和方法。

通过测序人类基因组,我们可以发现人类基因组中的未知功能区域,为基因编辑、基因治疗、基因驱动等技术提供新的靶点。

我们还可以利用人类基因组的数据,开发新的算法、软件、数据库、平台等工具,为基因组学的研究和应用提供更高效和便捷的支持。

人类基因组测序的历史和进展

人类基因组测序是一个国际性的任务,自从1990年启动了人类基因组计划以来,已经取得了巨大的进展。在21世纪初,该计划生成了人类基因组的第一个序列。

2022年,一个由全球科学家组成的端粒到端粒(T2T)联盟,呈现了一个完整的人类基因组序列,称为T2T-CHM13。这个序列填补了20年前测序的人类基因组的一些空白,达到了“连续性和准确性的最高水平”。

T2T-CHM13有望取代目前在研究和医学中使用的美国参考基因组GRCh38。

然而,尽管T2T-CHM13的组装是“一个了不起的科学成就”,但它并不代表一个“真实的人类个体”的基因组,因为它来源于一个“水泡状胎块”——一个没有母体染色体,只有两套复制的父系染色体的不可行的受精卵。

这也意味着T2T-CHM13是一个“单倍体基因组”,只包含一套染色体,没有Y染色体。但它仍然被认为是一个完整的无缝基因组,因为它测序了从端粒到端粒的染色体。

中国科学家的参考基因组是一个二倍体基因组,反映了真实的人类基因组,包含了两套染色体以及Y染色体

研究人员说,T2T-YAO的质量比目前所有的二倍体组装都要好,甚至它的单倍体版本也比T2T-CHM13更高质量。“T2T-YAO的所有评估都确保了它作为一个参考基因组的高质量”,也就是说,它是一个真实人类的准确代表。

T2T-YAO是如何构建的?

T2T-YAO的构建是一个复杂而精密的过程,涉及到多种测序和拼接技术的结合。

研究团队首先从一位来自陕西省的“健康年轻”男性村民的血液中提取了DNA,然后用一种叫做HiFi的测序技术对其进行了测序。HiFi是一种高保真的测序技术,可以生成长而准确的读段,也就是DNA的一小段序列。

HiFi的读段长度平均为20千碱基,而传统的测序技术的读段长度只有几百碱基。HiFi的读段准确率也高达99.9%,而传统的测序技术的读段准确率只有90%左右。

这些优势使得HiFi能够有效地覆盖人类基因组中的复杂区域,如重复序列、结构变异等,提高了基因组的连续性和准确性。

研究团队用HiFi测序技术生成了约200亿个读段,总共达到了人类基因组的1000倍的覆盖度。然后,他们用一种叫做TrioCanu的拼接技术对这些读段进行了拼接。

TrioCanu是一种基于三代测序的拼接技术,可以将读段按照父系和母系的来源进行分离,然后分别拼接成两套染色体。这样,就可以保留每套染色体上的变异信息,而不会将它们混合在一起。

TrioCanu还可以利用父系和母系的相似性,来纠正拼接过程中的错误,提高了基因组的准确性。

TrioCanu的拼接结果是一个二倍体基因组,包含了23对染色体,其中一对是性染色体。然而,这个二倍体基因组还不是完整的,因为染色体的两端,也就是端粒,还没有被测序和拼接。

端粒是一种保护染色体稳定性的结构,由重复的碱基序列组成。端粒的长度和序列在不同的个体和细胞中是不同的,而且随着年龄的增长而缩短。端粒的测序和拼接是一个极具挑战的任务,因为它们的重复性和变异性都很高,很难用传统的测序和拼接技术来处理。

为了解决这个问题,研究团队用一种叫做Nanopore的测序技术对端粒进行了测序。Nanopore是一种基于纳米孔的测序技术,可以直接测量DNA分子通过一个微小的孔洞时产生的电信号,从而推断出DNA的序列。Nanopore的优点是可以生成非常长的读段,甚至可以达到数百万个碱基。

这样,就可以覆盖整个端粒的长度,而不会被切断或丢失。Nanopore的缺点是读段的准确率不高,只有80%左右。这就需要用其他的技术来校正和验证。

研究团队用Nanopore测序技术生成了约10万个读段,总共达到了人类基因组的10倍的覆盖度。然后,他们用一种叫做T2T-Assembler的拼接技术对这些读段进行了拼接。

T2T-Assembler是一种专门用于端粒到端粒的拼接技术,可以将读段按照父系和母系的来源进行分离,然后分别拼接成两套端粒。这样,就可以保留每套端粒上的变异信息,而不会将它们混合在一起。

T2T-Assembler还可以利用其他的测序数据,如HiFi和TrioCanu的结果,来纠正拼接过程中的错误,提高了端粒的准确性。

T2T-Assembler的拼接结果是一个完整的二倍体基因组,包含了23对染色体,其中一对是性染色体,每条染色体都从端粒到端粒地测序和拼接。

这个二倍体基因组被命名为T2T-YAO,以纪念提供血液样本的村民和中国最早的帝王之一尧。T2T-YAO的质量被评估为非常高,达到了目前人类基因组测序的最高标准。

中国科学家构建的世界最详尽人类基因组T2T-YAO,不仅在科学上具有里程碑意义,也为精准医学及对中国人群遗传特性的研究开辟了新的视角和可能性。随着科技的进步和研究的深入,我们可以期待在未来更多地了解人类遗传的奥秘,以及这些知识如何被应用于提高人类健康和生活质量。中国在这一领域的突破,不仅标志着其科技实力的增强,也为全球医学研究与健康事业的发展贡献了重要力量。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部