新技术揭开了疾病和进化背后的DNA秘密


  发布日期: 2025年01月21日

  来源:Nature

  文章内容   

新技术揭开了疾病和进化背后的DNA秘密

新的研究增加了我们对人类基因组功能的理解。

一个国际研究小组在了解基因表达如何在整个人类基因组中受到调节方面取得了重大进展。在最近的一项研究中,他们对顺式调控元件(CREs)——控制基因转录的DNA序列进行了全面分析。这项研究为CREs如何驱动细胞特异性基因表达以及这些区域的突变如何影响健康并导致疾病提供了有价值的见解。

CREs,如增强子和启动子,在决定基因何时何地被激活或沉默方面起着关键作用。虽然它们的重要性是众所周知的,但大规模分析它们的活动一直是一个长期的挑战。

“人类基因组包含无数的CREs,这些区域的突变被认为在人类疾病和进化中起着重要作用,”该研究的第一作者之一Fumitaka Inoue博士解释说。“然而,要全面量化它们在整个基因组中的活动非常困难。”

创新技术使大规模CRE分析成为可能

为了解决这个问题,该团队使用了一种称为基于慢病毒的大规模并行报告基因测定(lentiMPRA)的尖端技术,该技术是作者之前开发的。这种方法通过标记独特的DNA条形码来追踪它们的活动,从而可以同时分析数千个CREs。

利用lentiMPRA,研究人员在三种广泛使用的细胞类型中检测了多达68万个候选CREs:肝细胞(来自肝脏的细胞)、淋巴细胞(一种白细胞)和诱导多能干细胞(一种由正常体细胞制成的人工干细胞)。

这项研究揭示了几个关键的见解。在这三种细胞类型中,大约41.7%的CREs表现出活性。启动子,开始基因转录,显示依赖于序列取向,但对细胞类型特异性较低。促进基因转录的增强子,无论其取向如何都具有活性,并表现出细胞类型特异性。这些发现突出了这两种CREs功能的根本差异。

机器学习促进预测性基因调控

在这项研究中,基于大规模的实验数据,开发了几个机器学习模型来预测CREs的调节活动。MPRALegNet是一个在大量lentiMPRA数据集上训练的模型,被发现在预测任何DNA序列的调控活性方面是最准确和有效的。它的预测与实验结果密切一致,在某些情况下,它的表现与实验重复一样好。

该模型还证明了其识别重要转录因子结合基序(即决定CRE活性的短DNA序列)的能力,从而提供了对特定因子如何驱动细胞类型特异性基因表达的见解。例如,该研究分别确定了HNF4和GATA基序对肝细胞和淋巴细胞的活性至关重要。

通过对增强子活性的精确鉴定和量化,该研究为探索人类疾病的分子机制开辟了途径。未来的研究将集中在应用这种方法来研究遗传多态性,DNA序列的变化有助于个体差异和疾病易感性。

“最近,几乎完整的人类基因组已经被测序,但它的许多功能区域仍然未知。我们的发现将DNA序列信息与其功能作用联系起来。我们希望这些结果将有助于更深入地了解生物现象,包括人类疾病和进化,”Inoue博士说。

本研究还为ENCODE门户网站提供了一个可公开访问的CRE活动数据库,为全世界的研究人员提供了宝贵的资源。通过将大规模实验数据与机器学习相结合,这项工作为基因组学和个性化医疗的未来发现奠定了基础。此外,lentiMPRA和MPRALegNet等工具的使用将有助于研究人员更好地解开基因调控的复杂性,并探索人类基因组广阔的未知领域。

参考文献:“Massively parallel characterization of transcriptional regulatory elements” by Vikram Agarwal, Fumitaka Inoue, Max Schubach, Dmitry Penzar, Beth K. Martin, Pyaree Mohan Dash, Pia Keukeleire, Zicong Zhang, Ajuni Sohota, Jingjing Zhao, Ilias Georgakopoulos-Soares, William S. Noble, Galip Gürkan Yard?mc?, Ivan V. Kulakovskiy, Martin Kircher, Jay Shendure and Nadav Ahituv, 15 January 2025, Nature.


 

  交流讨论   

 

相关视频 猜你喜欢

生物通 版权所有
未经书面授权,所有页面内容、图片和设计不得以任何形式进行复制
Copyright © 2000-2020 eBiotrade.com, All Rights Reserved
本栏目业务联系电话:广州 020-87511980