《Nature》四代家系多平台基因测序技术突破发现大部分结构突变起源于父系生殖系


  发布日期: 2025年04月25日

  来源:Nature

  文章内容   

《Nature》四代家系多平台基因测序技术突破发现大部分结构突变起源于父系生殖系

在生命科学领域,人类遗传变异一直是科学家们探索的重要课题。其中,新生突变(De novo mutation,DNM)率的准确测定至关重要,它关乎对人类遗传疾病发生机制的理解、进化过程的追溯等多个方面。然而,以往大多数关于 DNM 的研究主要基于短读测序(SRS)数据,且常常将基因组中高度可变的区域排除在外,导致对 DNM 率的估计不够准确全面。例如,着丝粒、Y 染色体的异染色质区域等,这些区域包含大量重复序列,传统测序技术难以对其进行精确分析。为了突破这些局限,来自美国华盛顿大学医学院、犹他大学等多个研究机构的研究人员开展了一项极具意义的研究。

研究人员选取了一个四代、28 人的家庭(CEPH 1463)作为研究对象。之所以选择这个家庭,是因为它在过去三十年里经过了深入研究,为此次研究提供了丰富的前期数据基础。研究团队利用五种互补的短读和长读测序技术,对该家庭所有成员进行基因组测序,并成功对每个二倍体人类基因组的 95% 以上进行了定相和组装。这一成果为后续精确分析 DNM 率奠定了坚实基础。该研究成果发表在《Nature》上,对生命科学和健康医学领域产生了深远影响。

在技术方法上,研究人员主要运用了以下关键技术:一是多种测序技术结合,包括 PacBio 高保真(HiFi)测序、超长牛津纳米孔技术(UL - ONT)测序、Strand - seq、Illumina 测序以及 Element AVITI Biosciences 测序,从不同角度获取基因组信息;二是使用两种杂交基因组组装管道 Verkko 和 hifiasm,生成高度连续的定相基因组组装;三是通过构建高分辨率重组图谱,利用多种方法确定减数分裂断点,分析重组事件。此外,研究人员还从血液和细胞系中获取 DNA 样本进行测序分析,确保数据的准确性和可靠性 。

下面来看看具体的研究结果:

  • 基因组序列和组装:研究人员通过多种测序技术生成了深度全基因组测序(WGS)数据,并运用 Verkko 和 hifiasm 两种组装管道进行基因组组装。结果显示,Verkko 组装的连续性最佳,估计 G1 - G3 中 63.3% 的染色体接近端粒到端粒(T2T)水平,且成功测序和组装了 288 个着丝粒,序列和定相准确性都很高。这表明研究人员能够获取高质量的基因组组装结果,为后续变异检测提供了可靠的基础。

  • 多代变异数据集:基于测序数据,研究人员识别出大量单核苷酸变异(SNVs)、插入缺失(indels)和结构变异(SVs),且这些变异在第二代和第三代中符合孟德尔遗传规律。长读测序(LRS)使研究人员能够获取更多人类基因组区域信息,相比之前的研究有了显著提升。此外,还对移动元件插入进行了全面统计,并鉴定出多种以孟德尔方式分离的倒位,为深入研究遗传变异的传递和影响提供了丰富的数据。

  • 序列解析的重组图谱:研究人员利用三种不同方法构建了高分辨率重组图谱,识别出大量减数分裂断点,并对断点进行了精细定位。研究发现,15 - 20% 的父母同源染色体在传递过程中没有可检测到的减数分裂断点,且母系重组事件显著多于父系,父系重组偏向于染色体末端。同时,随着父母年龄的增长,减数分裂交叉事件减少,这一发现与基于短读测序数据的群体水平分析结果相反,为进一步研究重组机制提供了新的视角。

  • 新生 SNVs 和小 indels:研究人员通过特定策略检测新生小变异,发现 81.4% 的生殖系小 DNM 起源于父系单倍型,且与父亲年龄相关,而合子后突变(PZM)在父母起源上没有显著差异,也不受父母年龄影响。此外,DNM 在重复序列中显著富集,不同基因组区域的突变率存在差异。这有助于深入了解不同类型突变的发生机制和影响因素。

  • 新生 TRs:研究人员对串联重复序列(TRs)进行研究,包括短串联重复序列(STRs)和可变数目串联重复序列(VNTRs)。通过多种技术手段,他们准确检测到大量 TR 位点,并发现 TRs 是基因组中最易突变的位点之一,其突变率与重复单元大小和基序长度有关,且存在父系偏向。研究还鉴定出 32 个反复突变的 TR 位点,为研究遗传变异的稳定性和遗传性提供了重要线索。

  • 着丝粒传递和新生 SVs:研究人员对 288 个完全组装的着丝粒进行分析,发现 12% 的着丝粒存在新生 SVs,这些 SVs 主要发生在 α - 卫星高阶重复(HOR)阵列中,且可能对着丝粒相关区域的甲基化和动粒附着位点产生影响。此外,还估计了着丝粒的 SNV DNM 率,发现其显著高于常染色体区域,为理解着丝粒的遗传变异和功能提供了新的依据。

  • Y 染色体突变:研究人员对携带 R1b1a - Z302 Y 单倍群的九名男性进行研究,发现 Y 染色体的 DNM 主要发生在 Yq12 异染色质卫星区域,估计的 DNM 率比之前报道的 Y 常染色质区域高一个数量级。此外,还鉴定出多种类型的 Y 染色体突变,包括 SNVs、indels 和 SVs,且这些突变大多位于短读无法可靠映射的区域,为研究 Y 染色体的进化和遗传变异提供了重要信息。

  • 新生 SVs:研究人员在八名个体中验证了 41 个新生 SVs,其中大部分起源于父系生殖系,且与 TRs 相关。研究发现,非等位同源重组(NAHR)不太可能是这些新生 SVs 的主要起源机制,并鉴定出一个新的逆转录转座事件,为研究基因组结构变异的发生机制提供了新的证据。


在研究结论和讨论部分,研究人员指出,他们的多平台、多代、基于组装的研究方法能够获取基因组中一些最重复的区域信息,提高了 DNM 检测的灵敏度和特异性。研究估计每代有 98 - 206 个 DNM,发现了强烈的父系偏向和与父龄相关的增加趋势,且不同基因组区域的 DNM 率差异显著。此外,研究还发现 16% 的新生 SNVs 为合子后起源,修正了以往对其比例的估计。同时,研究人员也认识到该研究存在一些局限性,如对同聚物的检测仍有挑战、无法对近端着丝粒区域进行全面分析等。但总体而言,这项研究为理解人类遗传变异的基本过程提供了重要的参考数据集,对未来研究人类遗传疾病的发生机制、进化过程以及新算法和测序技术的发展具有重要意义。它为后续研究指明了方向,推动了生命科学和健康医学领域对人类遗传变异的深入探索。


 

  交流讨论   

 

相关视频 猜你喜欢

生物通 版权所有
未经书面授权,所有页面内容、图片和设计不得以任何形式进行复制
Copyright © 2000-2020 eBiotrade.com, All Rights Reserved
本栏目业务联系电话:广州 020-87511980