超越人类基因组,风起二十载的多组学技术何以吸金?

超越人类基因组,风起二十载的多组学技术何以吸金?
2022年05月13日 12:56 亿欧

文|林怡龄

编辑|刘聪

2016年末,美国启动的癌症“登月计划”,让基于基因组学研究推动药物变革进展的风潮更加流行。但疾病的发生、发展是一个复杂的过程。近年来,单一组学研究瓶颈逐步显现。随之而来的,是多组学研究渐成发展趋势。

2020年新冠疫情爆发后,科学家就将多组学技术运用到了对新冠病原体的研究中,最新的成果于今年3月份发布在了Cell Reports Medicine上。事实上,多组学技术是一种结合两种或两种以上组学的研究方法,如将基因组、转录组、蛋白组和代谢组等各组学的数据加以整合分析。

而这项发展不到20年的技术,如今正在引爆一个新的风口。

过去三年里,单细胞测序公司10x Genomics、NGS和多组学系统开发商Singular Genomics陆续上市,点燃了行业热情。眼下,这股热潮也传到了中国——上市公司加紧布局;一级市场上,众多初创企业拿下了A轮及A+轮的融资。

只是不免会问,多组学技术为何会成为重要关注点?它对未来医疗又意味着什么?

为什么要关注多组学?

2003年,人类基因组计划的完成,预示着基因医学的纪元已经到来。那是人类第一次可以深入了解并阅读生命蓝图——DNA。

人类基因组大约包含25000个基因,每个基因通常都会编码一种在细胞中执行特定功能的蛋白质。在这个过程中,DNA序列会被“转录”成一段信使RNA(mRNA),它将作为载体将信息从细胞核传输到细胞主体,并在那里被“翻译”为蛋白质。

如果指令错误,如DNA中存在突变,那么将会影响到蛋白质,这可能导致一些功能部分或者全部丧失,继而出现生物学缺陷。但仅依据基因组,人们很难判断功能丧失的程度。基因的表达水平,最终能产生多少蛋白质,亦都事关人体是健康还是生病。

多组学的出现,很好的解决了这一点。如果说原来基于单一组学的研究好比是人们拿着放大镜观察一头大象,那多组学的出现,就是用卫星的手段,窥得大象的全貌。

在多组学研究中,人们能够从多分子层次出发,包括研究表观基因组(表明哪些基因有多大可能被表达)、转录组(揭示不同基因变体的表达程度)、蛋白质组(基因从mRNA翻译的正确程度)、代谢组(这些蛋白质多大程度上发挥作用)等细分方向,从多个维度呈现生物系统中立体的生物学过程。

更重要的是,多组学还提供了不同细胞和组织类型随时间变化的动态视图,而不仅是基因组的单独静态快照。这将使人类更为全面地了解身体状况,推动个性化医疗的发展。

“多组学是(医学)前进的唯一途径,”英国牛津大学的流行病学家Cornelia van Duijn曾如此说道。“我们不能一次只研究一个基因的影响,而是需要研究所有的总和。此外,我们需要的也不止是一个‘组学’层面的数据集,这样会遗漏信息。”

尽管该项技术的出现只是近20年的事情,但人们已经利用多组学在一些疾病领域实现突破。2021年4月份,一个研究脑海绵状血管瘤的团队在《自然》杂志上发表了一篇论文,首次详细说明了其疾病机制与癌症的相似之处。而如果没有最新的多组学研究,这一发现是不可能实现的。

多组学的应用领域和挑战有哪些?

实际上,以疾病领域来看,从多组学技术率先获益的第一大领域,便是癌症。从实体瘤到急性髓系白血病(AML)等,同时检查基因型和表型变化都在推动癌症研究。

Nature Portfolio曾援引生物学家Jean-François Deleuze的话表示“将多组学应用于癌症相对容易。”原因就在于肿瘤样本可以较为直接地获取。此外,对于一些罕见病,如脊髓性肌萎缩症(SMA),研究人员亦可通过肌肉活检的基因组学和转录组学分析相结合来确诊。

但对于诸如帕金森、阿尔茨海默症(AD)等神经退行性疾病,获取活检样本并不容易,甚至不合伦理。而结合优质表型数据(如影像学信息),是现下一个可行的途径。

随着老龄化时代的到来,AD已经被视为是一个潜在的千亿美元级药物市场。但过往的药物研发却屡屡不顺,以致于这个千亿级的市场又被称为新药研发的黑洞。随着多组学技术的出现,基于基因研究结果和转录组的整合分析,加大了研究者对AD病理生理学改变机制的理解。

眼下,在更大药企深耕的肿瘤领域,得益于二代测序技术NGS的普及和大量组学信息数据的积累,整合多组学数据的确更能窥探疾病的全貌。但随之而来的问题是,如何分析现有的数据资源以及拥有哪些工具,得以帮助研究者从庞大的数据中建立因果关系,则是他们不得不面对的问题。

序祯达生物科技总经理兼首席技术官李源在近日红杉中国智能医疗基因组学孵化器在线举办的“云上会客厅—产业加速(基因组学专场)”上就曾指出,眼下多组学数据分析的挑战,包括数据异质性,稀疏性,异常值;疾病类别的不均一性,过度拟合;特征数量多于数据数量,算法的选择;方法的透明性和可解释性等。

业内普遍认为,数据异质性是一个瓶颈。究其原因,是这些数据通过不同的技术和平台获取,数据存储和格式各式各样。

分析师或调查人员可能会面临的问题是,例如不同数据的规范化,与单个组学数据集有关的数据转换等。而在整个大型多组学数据集时,如何给定维度进行约束和存储空间限制等,都会影响到研究的进行。“目前还没有标准工具可整合分析这些数据。”Deleuze说。

另一个挑战是多组学分析的高成本,它需要大量的时间、金钱和技术人员的投入。

一切才刚开始。对于世纪之交的基因组学研究而言,时间和成本是其广泛应用到临床的障碍。如今,多组学的研究并非几个组学研究的简单相加,其存在的问题远比单一组学的要多。

不过,随着研究人员在生信分析和工具运用上的不断提升和突破,多组学除了在理解疾病机制上有所应用之外,它也在进一步推动新药研发。

过往,基因组学的出现已经缩短了新药的研发周期,降低成本和提高开发效率。但新药研究依旧充满挑战和不确定性,原因就在于单一的研究方法和思路,对复杂疾病如癌症的发展机理只是管中窥豹。

多组学技术的出现,在李源看来,将推动更高效的药物靶点发现、更精细的用药人群定位和更有效的生物标志物检测。他于2020年创立的序祯达,瞄准的便是用多组学技术驱动创新药物研发的方向。

而像序祯达一样的初创公司的成立和发展,成为了多组学技术热潮在中国的一个投射。

美股接连IPO,多组学发展掀起热潮

过去的两三年时间里,美国市场迎来了两家IPO公司,让多组学技术再度引发关注。

2019年,基因测序独角兽10x Genomics在纳斯达克上市,尽管面临诉讼官司,但它的开盘价还是达到54美元,市值一度超过50亿美元。前一年,在收购了Epinomics公司后,它还推出了多组学单细胞分析产品。该产品也是第一个适用于快速且大规模分析单细胞表观基因组特征的商业化解决方案。

而最近两年,它又因为空间转录组学高居热搜榜,其新品计划也备受瞩目。今年下半年,10x Genomics就将推出升级版Visium产品,其空间分辨率提高了400倍,接近单细胞水平。

2021年,另一家生命科学技术公司Singular Genomics Systems, Inc.也登陆了纳斯达克。该公司利用下一代测序(NGS)和多组学技术构建产品,为研究人员和临床医生提供支持。

Singular Genomics Systems的产品开发管道包括两个初始集成解决方案。其中,G4 集成解决方案针对NGS市场。PX集成解决方案则面向单细胞、空间分析和蛋白质组学市场。目前,这两种方案都用于许多不同的细分市场,包括基础生物学、肿瘤学、免疫学、神经学、遗传疾病、传染病、人类微生物组等。

据悉,在IPO时,该公司仍未有任何产品上市。对于一个测序公司来说,这种情况还是比较少见的。不过,这并不妨碍它在IPO时依旧吸金超2亿美金。

如今,国外的热潮也席卷到了中国。一边是上市公司推进布如2021年在科创板上市的诺禾致源,便加紧搭建多组学整合研究技术体系平台,并在国际期刊上多次发表论文;另一边,应用多组学技术的初创公司不断涌现,并在这两年获得不错的前期融资。

据不完全统计,2021年至2022年3月份,中国就有近10家公司获得融资,融资轮次皆在B+轮及以前,金额从数千万元到近亿美元不等。

在此前的一场活动上,北极光创投创始人邓锋在被问及基因检测和IVD行业最想投的三家公司时,就曾如此回答:“没法具体到家公司,如果上游出现革命性的技术,我们一定会想投,比如做多组学、数据存储、单细胞制备的公司。”

他认为,未来多组学的集成肯定是一个方向,将来一定是蛋白组学、基因组学的结合。对大公司而言,数据将是很有力的武器。

参考文章:

1.生物探索:Cell Reports Medicine | COVID-19的多组学研究:照亮被忽视的角落;

2.Nature Portfolio:如何将珍贵样本中的信息最大化:多组学的力量 | 推广;

3.Forbes:Why Multi-Omics Is The Future Of Biological Analysis

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部