Science:机器学习如何揭示基因转录


  发布日期: 2024年05月15日

  来源:Science

  文章内容   

Science:机器学习如何揭示基因转录

由德克萨斯大学西南医学中心的研究人员领导的一个研究小组开发了深度学习模型,以确定一套控制启动子活动的简单规则-启动子是DNA的区域,启动基因产生蛋白质的过程。他们的研究结果发表在《Science》杂志上,可以让我们更好地理解启动子是如何在健康和疾病中促进基因调控的。

“尽管启动子对每个基因的功能都至关重要,但尽管几十年的研究已经定义了它们的许多特征,但我们对这些遗传元件如何运作的理解是不完整的。我们的研究揭示了这些序列如何在人类和其他哺乳动物中发挥作用,”德克萨斯大学西南分校Lyda Hill生物信息系助理教授Jian Zhou博士说。Jian Zhou博士与第一作者、研究生Kseniia Dudnyk和德克萨斯大学西南分校儿童医学中心研究所的前研究员Jian Xu博士共同领导了这项研究。

细胞用来进行活动的蛋白质的产生始于一个被称为转录的过程。当RNA聚合酶蛋白附着在DNA链上并将编码信息复制或转录到RNA分子中时,就会发生这种情况。RNA聚合酶附着开始转录的区域称为启动子。在人类中,启动子通常由数百个碱基对组成,这些碱基对是构成DNA的单位。尽管研究人员已经确定了一些DNA启动子区域共享的共同碱基对序列,但这些序列在人类启动子中通常不存在,这使得DNA序列如何指导转录过程的规则不清楚。

Kseniia Dudnyk是德州大学西南分校周实验室的一名研究生。

为了更好地定义人类的启动子及其运作方式,研究人员开发了一种机器学习程序,他们将其命名为Puffin。在分析了数以万计的已知人类启动子的数据后,该程序确定它们由三种类型的序列模式组成:基序、启动子和三核苷酸。

Puffin表明,根据这些元素的排列方式,它们可以激活或抑制基因的转录。Puffin还可以预测这些元素的排列如何指导RNA聚合酶优先转录单链DNA或同时转录两条相反方向的DNA。这种双向转录在人类基因中很常见。

该程序进一步表明,小鼠和其他哺乳动物在控制启动子操作方面具有相似的规则集。此外,Puffin还允许研究人员预测如果启动子发生突变,转录是否会发生以及如何发生,这一发现与实验结果非常吻合。

该研究的作者认为,Puffin可以帮助他们了解启动子如何在健康细胞中起作用,以及启动子中与疾病相关的改变如何导致基因转录的变化。这个程序可以在一个免费的web服务器上获得,以便其他研究人员可以测试任何感兴趣的启动子序列。他们补充说,使用类似的机器学习方法可以深入了解基因组的其他方面,这些方面仍然没有得到很好的理解。

       

         

                   

         

       

 

  交流讨论   

 

相关视频 猜你喜欢

生物通 版权所有
未经书面授权,所有页面内容、图片和设计不得以任何形式进行复制
Copyright © 2000-2020 eBiotrade.com, All Rights Reserved
本栏目业务联系电话:广州 020-87511980