来源:生物世界
排版丨水成文
在人类基因组中,有超过 20000 个基因序列是用于编码蛋白质的,这类基因如果发生了错义突变,将影响蛋白产物的结构和功能。其中,近 5000 种与蛋白质有关的错义突变和单基因遗传病相关,例如脊髓性肌肉萎缩症、地中海贫血、白化病等等。
然而,几乎对所有蛋白质而言,变异对其功能的影响目前尚未被充分解析。
2025 年 1 月 8 日,西班牙巴塞罗那基因组调控中心(CRG)联合华大生命科学研究院,在国际顶级学术期刊 Nature 上发表了题为:Site-saturation mutagenesis of 500 human protein domains 的研究论文。
该研究成功构建了名为“Human Domainome 1”的数据集,这是一个巨大的蛋白质变体库,包括 522 个人类蛋白质结构域的 50 多万种突变,这也是迄今为止最大的人类蛋白质结构域变体库,揭示了蛋白质稳定性在致病机制中的关键作用。
如果将细胞视为一个小小的建筑工地,氨基酸就像是工地上的原材料(例如砖块);肽键就像是将原材料连接起来的“粘合剂”(例如水泥);而根据DNA指令所形成的氨基酸序列则像是施工图纸,规定了原材料的排列顺序。
根据不同的“图纸”,氨基酸会连接成各异的多肽串。多肽串又经过弯曲、扣合,折叠成特定的三维结构,才能成为具有生物活性的蛋白质,进而发挥功能。
一条肽链上能独立折叠成紧密而稳定结构的任何氨基酸片段,被称为蛋白质结构域,其作为折叠的功能单元,为研究突变对蛋白质稳定性和功能的影响提供了理想模型。
在这项最新研究中,研究团队采用了华大自主研发的高通量并行合成技术,构建了包含超过 120 万种蛋白质结构域突变体的深度饱和扫描突变文库。通过整合高通量测序和蛋白质丰度片段互补实验(aPCA)技术,该研究精准量化了突变对蛋白质稳定性的影响,发现突变对蛋白质核心区域的稳定性影响更为显著,而表面区域突变的影响较弱。该研究涵盖了 195 个全 α(螺旋)、127 个全 β(折叠)、47 个 α+β 等多种蛋白质结构类型,以及 275 个来自人类疾病基因的结构域,其中包含 108 个已注释的致病突变。
通过 Boltzmann 热力学模型,研究发现突变对稳定性的效应在结构同源的蛋白中高度保守。利用该模型,研究团队进一步预测了 7271 个蛋白质结构域中的超四百万种突变,涵盖了 13878 种临床注释突变,包括 1310 种致病变体和 951 种良性变体。
分析结果表明,52% 的致病变体均表现出稳定性下降现象。而对整个数据集的分析发现,超过 60% 的致病性错义突变会显著降低蛋白质稳定性,从而揭示了蛋白质稳定性在疾病发生中的关键作用。
研究团队表示,团队的终极目标是绘制出每一种人类蛋白质的每一种可能的突变产生的影响。这是一项雄心勃勃的事业,可以改变精准医学。
该研究所建立的高通量突变体库构建与解析能力,不仅提升了对临床突变的解释能力,还为蛋白质家族域的全基因组研究提供了新途径。未来,“Human Domainome 1”数据集有望成为基础科学研究、临床遗传学及药物开发领域的重要工具,推动人类基因组精确注释和精准医学的实现。
西班牙巴塞罗那基因组调控中心的 Antoni Beltran 博士为论文第一作者,华大生命科学研究院沈玥研究员、江湘儿副研究员为论文共同作者,巴塞罗那基因组调控中心 Ben Lehner 教授为通讯作者。该研究还得到了华大工程生物学长荡湖研究所、常州新一产生命科技有限公司等机构的大力支持。本研究得到了包括欧洲研究理事会(ERC)、西班牙科学与创新部、中国国家自然科学基金、江苏省新研机构等多项资助支持。
论文链接:
https://www.nature.com/articles/s41586-024-08370-4
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有