发布日期: 2024年01月12日
来源:MIT
文章内容
对细胞中的所有RNA进行测序可以揭示大量关于细胞功能的信息,以及它在特定时间点的功能。然而,测序过程破坏了细胞,使得研究基因表达的持续变化变得困难。
麻省理工学院开发的另一种方法可以使研究人员在很长一段时间内追踪这些变化。这种新方法基于一种被称为拉曼光谱的非侵入性成像技术,不会伤害细胞,而且可以重复进行。
利用这项技术,研究人员表明,他们可以在几天内监测胚胎干细胞分化成其他几种细胞类型的过程。这项技术可以研究长期的细胞过程,如癌症进展或胚胎发育,有朝一日可能用于癌症和其他疾病的诊断。
“有了拉曼成像,你可以测量更多的时间点,这对研究癌症生物学、发育生物学和许多退行性疾病可能很重要,”麻省理工学院生物和机械工程教授、麻省理工学院激光生物医学研究中心主任、该论文的作者之一Peter So说。
Koseki Kobayashi-Kirschvink是麻省理工学院以及哈佛大学和麻省理工学院Broad研究所的博士后,他是这项研究的主要作者,该研究发表在今天的《Nature Biotechnology》杂志上。
成像基因表达
拉曼光谱(Raman spectroscopy)是一种非侵入性技术,通过向组织或细胞照射近红外或可见光来揭示组织或细胞的化学成分。麻省理工学院的激光生物医学研究中心自1985年以来一直致力于生物医学拉曼光谱研究,最近,So和该中心的其他人开发了基于拉曼光谱的技术,可用于诊断乳腺癌或测量血糖。
然而,拉曼光谱本身不够灵敏,无法检测到单个RNA分子水平变化这样小的信号。为了测量RNA水平,科学家通常使用一种称为单细胞RNA测序的技术,这种技术可以揭示组织样本中不同类型细胞中活跃的基因。
在这个项目中,麻省理工学院的团队试图通过训练计算模型将拉曼信号翻译成RNA表达状态,将单细胞RNA测序和拉曼光谱的优势结合起来。
“RNA测序给了你非常详细的信息,但它是破坏性的。拉曼是无创的,但它不能告诉你任何关于RNA的信息。因此,这个项目的想法是使用机器学习来结合两种模式的优势,从而让你了解单细胞水平上基因表达谱的动态,”Kobayashi-Kirschvink说。
为了生成数据来训练他们的模型,研究人员对小鼠成纤维细胞(一种皮肤细胞)进行了因子处理,使细胞重新编程成为多能干细胞。在这个过程中,细胞也可以转化为其他几种细胞类型,包括神经细胞和上皮细胞。
利用拉曼光谱,研究人员对细胞在18天内分化的36个时间点进行了成像。每张图像拍摄后,研究人员使用单分子荧光原位杂交(smFISH)分析每个细胞,该技术可用于可视化细胞内特定的RNA分子。在这种情况下,他们寻找编码九种不同基因的RNA分子,这些基因的表达模式因细胞类型而异。
smFISH数据可以作为拉曼成像数据和单细胞RNA测序数据之间的链接。为了建立这种联系,研究人员首先训练了一个深度学习模型,根据从这些细胞中获得的拉曼图像来预测这9个基因的表达。
然后,他们使用Broad研究所先前开发的名为Tangram的计算程序,将smFISH基因表达模式与他们通过对样本细胞进行单细胞RNA测序获得的整个基因组图谱联系起来。
然后,研究人员将这两个计算模型结合成一个他们称之为Raman2RNA的计算模型,该模型可以根据细胞的拉曼图像预测单个细胞的整个基因组图谱。
跟踪细胞分化
研究人员通过跟踪小鼠胚胎干细胞分化成不同细胞类型的过程来测试他们的Raman2RNA算法。他们连续三天每天四次拍摄细胞的拉曼图像,并使用他们的计算模型预测每个细胞相应的RNA表达谱,他们通过将其与RNA测序测量结果进行比较来证实这一点。
利用这种方法,研究人员能够观察到单个细胞从胚胎干细胞分化为更成熟的细胞类型时发生的转变。他们还表明,在两周的时间里,他们可以追踪小鼠成纤维细胞被重新编程为诱导多能干细胞时发生的基因组变化。
“这是一个证明,光学成像提供了额外的信息,使你可以直接跟踪细胞的谱系和它们的转录进化,”So说。
研究人员现在计划使用这项技术来研究其他随时间变化的细胞群,比如衰老细胞和癌细胞。他们现在正在实验室培养皿中培养细胞,但在未来,他们希望这种方法可以发展成为一种潜在的诊断方法,用于患者。
“拉曼的最大优势之一是它是一种无标签的方法。这还有很长的路要走,但人类翻译是有潜力的,这是使用现有的侵入性技术来测量基因组图谱无法完成的,”麻省理工学院的研究科学家、该研究的作者之一Jeon Woong Kang说。
交流讨论