首页   

Nat Commun | 陈春龙课题组开发机器学习算法揭示癌症进展中的DNA复制时序动态异质性

BioArt  · 生物  · 21 小时前

正文


DNA是细胞遗传物质的重要载体,DNA复制是生物维持遗传性状和生理活动的核心生物学过程。DNA复制程序对基因组突变的出现起着至关重要的作用,因为其中很大一部分基因组突变发生在细胞分裂期间。特别是,复制压力会削弱基因组的稳定性,并导致突变随着时间的推移在基因组上积累。基因组突变虽然是进化的重要驱动力,但也会导致许多疾病的发展,特别是癌症。因此,了解 DNA 复制如何影响基因组突变的出现对于制定新的预防和治疗策略至关重要。

癌症治疗的主要挑战之一在于肿瘤细胞的高可塑性和异质性,这使得对肿瘤发生机制的研究以及有效疗法的开发变得复杂。为了更好地理解这些现象,2025年2月8日,来自法国居里研究所(Institut Curie)的研究团队在Nature Communications上发表了文章Unravelling single-cell DNA replication timing dynamics using machine learning reveals heterogeneity in cancer progression该研究开发了一种名为“Mix ‘n’ Match”(MnM)的机器学习工具,能够从复杂的单细胞全基因组测序数据中精准解析DNA复制时序(Replication Timing, RT),并揭示癌症进展中的基因组异质性。这一研究成果不仅填补了单细胞 DNA 复制研究领域的空白,还为癌症研究提供了新的视角,尤其是进一步理解肿瘤内部异质性和DNA复制动态与癌症的进展机制的关系。


DNA复制是细胞生命周期中的关键过程,确保遗传信息准确传递给子细胞。然而,复制过程中的错误可能导致基因组不稳定,进而引发癌症。在癌症细胞中,DNA复制时序的紊乱与肿瘤的发生、进展和治疗抵抗密切相关。尽管已有大量研究关注癌症中的基因组变异,但单细胞水平的DNA复制时序研究仍处于起步阶段,尤其是在肿瘤异质性方面。

传统的群体水平的测序技术(Bulk Sequencing)虽然能够检测到DNA拷贝数变异(CNVs),但无法捕捉到肿瘤内部的单细胞异质性。近年来,单细胞测序技术的发展为研究癌症异质性提供了新的工具,但如何从单细胞数据中准确解析DNA复制时序仍是一个挑战。法国居里研究所陈春龙教授课题组于2022年在Nature Communications上发表标题为Kronos scRT: a uniform framework for single-cell replication timing analysis的研究论文,首次开发了新的算法和工具Kronos scRT (https://github.com/CL-CHEN-Lab/Kronos_scRT),通过高通量单细胞基因组测序以及数据分析,成功在单细胞水平上研究基因组复制程序(详见BioArt报道:Nat Commun | 陈春龙课题组开发新算法在单细胞水平研究DNA复制程序。然而该方法主要适用于分析实验室培养的细胞系生成的数据,对于如何对具有高度异质性的肿瘤样本进行高通量的自动分析仍是该领域的难题。

为了解决这一问题,研究团队开发了工具Mix ‘n’ Match (MnM) (https://github.com/CL-CHENLab/MnM),结合了多种机器学习算法,能够从单细胞拷贝数数据中准确推断DNA复制时序,并识别肿瘤中的不同细胞亚群。MnM的三大核心功能包括:

  1. 智能数据填补(Imputation):通过KNN近邻算法,MnM能够在低覆盖度的单细胞测序数据中填补单细胞拷贝数数据中的缺失值,确保数据的完整性。

  2. 复制状态识别(Replication State Classification):利用深度学习模型,MnM能够准确区分处于复制状态(S期)和非复制状态的细胞,避免传统实验方法(如流式细胞术 FACS)可能带来的误差。

  3. 细胞亚群分类(Subpopulation Clustering):采用无监督学习方法(如 UMAP 降维和 DBSCAN 聚类),MnM能够识别肿瘤中的不同细胞亚群,揭示肿瘤内部的基因组异质性。

图1. MnM 中使用的机器学习技术和工作流程。


研究团队利用MnM分析了超过119,000个高质量人类单细胞数据,涵盖了多种正常和癌细胞系、患者肿瘤样本和患者来源的异种移植(PDX)样本。研究发现了以下几个重要结果:

  1. 细胞系 vs. 患者样本:实验室培养的癌细胞系与真实患者肿瘤样本相比,后者的 DNA 复制异质性更为显著。这表明,肿瘤微环境可能对 DNA 复制过程产生深远影响。
  2. 复制时序的稳定性:尽管癌症细胞的基因组结构发生了广泛变化,但大多数情况下,其 DNA 复制的基本模式仍保持相对稳定,提示 DNA 复制时序可能受到某些关键调控机制的保护
  3. 基因组变化与复制应激:研究发现,单细胞层面的 DNA 复制失调与染色体畸变密切相关,进一步支持了复制应激在癌症进展中的关键作用


未来展望:为癌症研究和治疗提供新工具


MnM工具的推出为癌症研究提供了新的工具和资源。通过解析单细胞水平的DNA复制时序,研究人员可以更深入地理解肿瘤内部的异质性,揭示癌症进展中的关键机制。此外,MnM还可以用于研究其他与DNA复制相关的疾病,如遗传性疾病和衰老相关疾病。研究团队表示,未来他们将进一步优化MnM工具,并扩展其应用范围,以便在临床应用中发挥更重要作用。例如通过识别 DNA 复制时序的异常模式,MnM 或可帮助更早发现癌变细胞及其来源。再者,分析癌症患者的单细胞复制异质性,有助于预测个体对不同治疗方案的响应,从而优化治疗策略。最后,研究 DNA 复制调控机制可能揭示新的治疗靶点,为抗癌药物的研发提供新思路。随着单细胞测序技术的不断发展,MnM有望成为癌症研究中的重要工具,帮助科学家们更好地理解癌症的发生、进展和治疗抵抗机制。

总之,该研究不仅开发了一种强大的机器学习工具,还为癌症研究提供了新的视角。通过揭示单细胞水平的DNA复制时序动态,MnM为理解肿瘤异质性和癌症进展提供了重要的工具和资源。未来,随着更多数据的积累和技术的进步,MnM有望在癌症研究和临床应用中发挥更大的作用。


实验室介绍 及 博士后招聘信息
居里研究所(Institut Curie)坐落于浪漫之都法国巴黎,由著名科学家居里夫人于1909年创立,是集科研、教学和医疗为一体的世界顶尖研究机构。陈春龙博士为法国科学研究中心(CNRS)终身主任研究员(Research Director), 法国巴黎文理研究大学(PSL Research University)与索邦大学(Sorbonne University)博士生导师。其研究团队主要运用功能基因组学等交叉学科方法,研究DNA复制程序,以及复制压力与基因组稳定性与疾病发生间的关系,在Nature、Science、Cell、 Mol. Cell、Nat Commun等高水平一级刊物发表科研论文50余篇。实验室目前有博士后职位(wet和dry labs)正在招聘中,详细信息见实验室主页:
https://institut-curie.org/team/chen。

原文链接:
https://doi.org/10.1038/s41467-025-56783-0  

制版人:十一



参考文献


1. Josephides, J. M., & Chen, C. L. (2025). Unravelling single-cell DNA replication timing dynamics using machine learning reveals heterogeneity in cancer progression. Nature Communications. https://doi.org/10.1038/s41467-025-56783-0


BioART战略合作伙伴

(*排名不分先后)


BioART友情合作伙伴
(*排名不分先后)

转载须知


【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。





BioArt

Med

Plants

人才招聘

会议资讯



近期直播推荐



© 2024 精读
删除内容请联系邮箱 2879853325@qq.com