您当前所在位置: 河南省科学技术协会 综合信息 科技瞭望

研究揭示并校正多组学数据中细胞周期干扰效应

来源: 中国科学院 时间: 2025-06-04

  近日,中国科学院北京基因组研究所(国家生物信息中心)蔡军团队联合中国农业科学院北京畜牧兽医研究所郑彩宏团队,以干细胞与分化细胞为模型,梳理了细胞周期结构差异对多组学数据解释的全局性影响,构建了针对不同组学类型的通用分析框架,为鉴定高增殖细胞群体中真实的生物学信号提供了科学依据和技术路径。

  在干细胞研究、胚胎发育及肿瘤等增殖活跃的生物学场景中,细胞周期结构差异是组学数据解读偏差的重要原因之一。研究提出,当样本中处于S期的细胞比例超过38%时,DNA的非同步复制影响拷贝数变异的识别,导致高假阳性率。对此,研究引入复制时序域(RTD)校正,以降低拷贝数变异鉴定的假阳性。

  同时,细胞周期影响染色质可及性和DNA甲基化的识别精度。研究发现,S期特异的染色质开放区域(OCRs)更富集于早期RTD区域,且与OCRs关联的假阳性拷贝数变异区域倾向于更高比例拷贝数扩增。细胞周期不同阶段共有的OCRs往往具有更高的转录活性关联性与调控功能。此外,差异甲基化区域的识别准确性受到细胞周期的影响。进而,研究通过整合转录组数据发现,相较于直接比较,基于细胞周期分型后进行独立比较的策略更有助于揭示潜在的生物学信号。在单细胞转录组层面,尽管目前已有多种单细胞分析方法试图消除细胞周期的干扰,但这些方法往往不足以彻底剥离细胞周期变量对差异表达基因识别的影响。研究比较了多种细胞周期分类工具,选定了分类准确性较高的Cyclone算法,并在此基础上构建出phase comparison策略,来提升差异表达基因的生物学相关性和功能注释精度。

  进一步,该研究评估了细胞周期在多组学分析中的干扰效应,并针对不同数据类型提出了解决策略。例如,通过RTD校正降低高S期比例群体中的CNV假阳性,来优化甲基化与转录组分析流程。研究结合Cyclone算法与phase comparison方法,以提升单细胞数据中差异基因的识别准确性。同时,研究通过模拟数据、生物学实验和功能注释等多维手段,验证了策略的有效性。

  上述研究揭示了细胞周期这一“被忽略的重要变量”在多组学解读中的作用。同时,该成果将细胞周期纳入分析流程,提升了组学数据的解释准确性,并为干细胞及肿瘤等高增殖背景下的精准分析提供了研究范式。

  5月28日,相关研究成果在线发表在《先进科学》(Advanced Science)上。研究工作得到中国科学院相关项目和北京市自然科学基金等的支持。

  论文链接

供稿人:杨越

审核人:文成锋