在人类基因组中,超过95%的基因都含有内含子,这些非编码序列必须被准确剪除,才能生成具有功能的成熟mRNA。然而,基因组中存在大量“假剪接位点”,它们在序列上与真实的剪接位点高度相似,不具备真正的剪接功能。如何在共转录过程中精准识别真实剪接位点,是维持基因表达精确性的关键。
中国科学院北京基因组研究所(国家生物信息中心)郝亚静团队与西湖大学付向东团队合作,首次揭示了RNA聚合酶II,作为唯一能在转录过程中“线性扫描”剪接位点的分子机器,如何通过“U2AF蛋白的动态循环”机制,在转录过程中精准识别真实剪接位点的分子机制。
RNA聚合酶II不仅是转录的核心引擎,更是共转录剪接过程中的关键调控者。该研究挑战了长期以来“RNA聚合酶II的CTD结构域对招募剪接因子至关重要”的传统观点。然而,CTD在招募剪接因子中的作用尚未被直接验证。通过使用CTD缺失的RNA聚合酶II变体,研究证实,RNA聚合酶II可以在不依赖CTD的情况下,与U2AF1、SNRNP70等剪接因子结合,揭示了独立于CTD的共转录剪接调控机制。
该研究揭示了RNA聚合酶II,在转录过程中动态调控剪接因子的招募与释放,实现对剪接位点的识别。RNA聚合酶II能够在转录过程中对成对的5’和3’剪接位点进行实时线性扫描,在源头上避免大量假剪接位点的错误识别,确保剪接的准确性与基因表达的精确调控。
传统观点认为,U2AF1与U2AF2总是以稳定异源二聚体形式存在,并共同参与剪接。此次研究发现,U2AF1以单体的形式直接结合在RNA聚合酶II上,U2AF2以单体形式加入后,与U2AF1结合形成异源二聚体,进而触发剪接初始复合物,从RNA聚合酶II上释放,进入后续剪接体组装催化阶段。这一发现打破了“U2AF1必须与U2AF2结合共同发挥作用”的传统认知,揭示了U2AF蛋白在剪接过程中动态循环的新机制。
基于上述发现,研究团队提出了“U2AF动态循环”模型,将共转录剪接划分为两个阶段。一是RNA聚合酶II依赖的剪接位点识别阶段:RNA聚合酶II通过RPB9招募U2AF1单体,RPB2和RPB2结合U1 snRNP,实现对新生RNA中成对剪接位点的识别,防止“假剪接位点”的错误识别。二是RNA聚合酶II非依赖的剪接体组装催化阶段:U2AF2与U2AF1结合形成异源二聚体,进而触发剪接初始复合物从RNA聚合酶II上释放,剪接体进入后续组装和催化阶段,不再依赖RNA聚合酶II。伴随着RNA聚合酶II的持续转录和延伸,释放后的RNA聚合酶II可以重新招募新的U2AF1单体和U1 snRNP,开启对下游剪接位点的成对识别,从而实现剪接过程的高效、精准、连续进行。
该研究为理解基因表达调控提供了全新视角。
相关研究成果发表在《科学》(Science)上。
供稿人:杨越
审核人:文成锋