发布日期: 2023年12月01日
来源:University of Waterloo
文章内容
滑铁卢大学的研究人员开发了GraphNovo,这是一个新的程序,可以更准确地了解细胞中的肽序列。多肽是细胞内的氨基酸链,是与DNA或RNA一样重要和独特的组成部分。
健康人的免疫系统可以正确识别不规则细胞或外来细胞(如癌细胞或有害细菌)的肽,然后针对这些细胞进行破坏。对于那些免疫系统有问题的人来说,有前途的免疫治疗领域正在努力重新训练他们的免疫系统来识别这些危险的入侵者。
这种测序过程对于以前可能没有分析过的新疾病或癌细胞来说尤其困难。虽然科学家们在分析以前研究过的疾病或有机体时可以利用现有的肽数据库,但每个人的癌症和免疫系统都是独一无二的。
为了在不熟悉的细胞中快速建立肽的轮廓,科学家们一直在使用一种称为de novo peptide sequencing的方法,该方法使用质谱法快速分析新样本。这个过程可能会使一些肽在序列中不完整或完全缺失。
GraphNovo利用机器学习,通过用肽序列的精确质量填补这些空白,显著提高了识别肽序列的准确性。这种准确性的飞跃可能会在各种医学领域带来巨大的好处,特别是在癌症的治疗和埃博拉和COVID-19等疾病的疫苗的开发方面。研究人员之所以取得这一突破,是因为滑铁卢大学致力于在技术与健康之间的界面上取得进步。
作者说:“如果我们没有一个足够好的算法,我们就无法建立治疗方法,现在,这些都是理论上的。但很快,我们就能在现实世界中使用它了。
Zeping Mao, Ruixue Zhang, Lei Xin, Ming Li. Mitigating the missing-fragmentation problem in de novo peptide sequencing with a two-stage graph-based deep learning model. Nature Machine Intelligence, 2023; 5 (11): 1250
交流讨论