生物分子建模 · AI 科学

AlphaFold 3 解读:用扩散模型预测生物分子复合体

AlphaFold 3 用扩散网络替换了 AlphaFold 2 的结构模块,在同一个模型里预测蛋白与核酸、配体、离子、修饰残基组成的整套复合体。

AlphaFold 3 解读:用扩散模型预测生物分子复合体

快速答案

AlphaFold 3 是一个能预测生物分子复合体联合三维结构的统一模型——蛋白连同 DNA、RNA、小分子配体、离子,以及化学修饰残基——而不再是一次只折叠一条蛋白链。最大的架构改动是:它去掉了 AlphaFold 2 中手工设计的结构模块,改用一个扩散网络直接生成原子坐标。在对生物学和药物研发最关键的相互作用上,它胜过了专用工具:尤其是在蛋白-配体结合上超过经典 docking,在蛋白-核酸结构上超过核酸专用系统。

从单个蛋白到完整复合体

AlphaFold 2 解决的是一个范围狭窄但重要的问题:输入序列,输出单个蛋白折叠。但细胞几乎从不让蛋白孤立工作。信号传导、催化、基因调控、免疫识别、药物结合,全都是相互作用事件——蛋白抓住一段 DNA,酶包裹住底物,抗体锁定抗原。要预测这些,过去得靠一堆互不兼容的工具:一个做蛋白-蛋白,一个 docking 程序做配体,另一个模型做 RNA。

AlphaFold 3 的前提是:这些应该由同一个网络全部处理。它接收一个混合系统——多条蛋白链、核酸、配体、离子,以及翻译后修饰——并预测每个原子相对其余部分的位置。这种统一才是真正的贡献;没有哪个单一基准能完整衡量它,真正说明问题的是:过去需要六七种工具的场景,如今一个模型就覆盖了。

基于扩散的架构

最核心的机制是改用扩散。AlphaFold 2 先用 Evoformer 处理进化比对,再用一个具备几何感知的结构模块逐帧搭建蛋白骨架。AlphaFold 3 保留了精简后的进化表示主干(Pairformer),但把结构模块换成了扩散模型——它学习把带噪声的原子位置去噪成最终结构。

这在两个实际层面很重要。其一,直接在原子层面生成坐标,正是模型能把配体或核苷酸当作氨基酸一样对待的原因——没有蛋白专属的骨架会被破坏。其二,团队必须额外加入训练手段,防止生成式模型造出看似合理实则错误的几何结构,而这恰是扩散模型的通病。这个取舍值得点明:带来通用性的架构,也正是会产生幻觉的架构。诚实的判断是:在这里,置信度分数比在 AlphaFold 2 中更需要被认真对待。

关键结果

这篇 Nature 论文的价值在于覆盖面加上确实的优势幅度,而不是某一个高分。在蛋白-配体相互作用上,AlphaFold 3 的准确率明显高于经典 docking 工具——而且不需要把结合口袋作为输入,而 docking 通常正是靠这一点来”开外挂”。在蛋白-核酸复合体上,它超过核酸专用预测器。在抗体-抗原界面上,它优于 DeepMind 此前的 AlphaFold-Multimer v2.3。与模型一同发布的还有 AlphaFold Server,一个免费网页工具,让研究者无需自行运行模型就能搭建并预测复合体。

诚实地说:这是同一个系统在多种相互作用类型上的全面胜出,这比刷爆某一个榜单更难、也更有用。但”准确率高于 docking”说的是排序和构象,而不是经过验证的结合强度。

局限与存疑

预测出来的结构是假设,不是实验证据。AlphaFold 3 输出的是一个静态、最可能的构象;它不会给你结合自由能、动力学、分子真正采样到的构象系综,也不涉及细胞环境。它可能”自信地出错”,在困难或全新的靶点上仍然如此。抗体-抗原预测尽管有所提升,仍属较弱的领域之一。

发布方式也招来了实打实的批评:完整模型和权重没有像 AlphaFold 2 那样开放,访问要走带用量限制的 AlphaFold Server,这限制了独立复现、拖慢了外部审视。对任何实验室而言,实际问题不是要不要信任 AlphaFold 3,而是如何给它定位——把它当作一个快速而强大的先验,告诉你哪些昂贵实验、docking 或分子动力学模拟值得做,而不是用它来替代这些。

常见问题

AlphaFold 3 能预测哪些 AlphaFold 2 做不到的东西?

AlphaFold 3 能在一个模型里预测混合分子类型的复合体——蛋白结合 DNA、RNA、小分子配体、离子和修饰残基。AlphaFold 2 是为折叠单条蛋白链而设计的(Multimer 把它扩展到蛋白-蛋白组装),无法原生处理配体或核酸。

AlphaFold 3 的架构和 AlphaFold 2 有什么不同?

AlphaFold 3 去掉了 AlphaFold 2 基于几何的结构模块,改在末端用一个扩散网络直接生成原子坐标,进化表示主干也精简成了 Pairformer。在原始原子层面工作,正是让一个网络能统一对待氨基酸、核苷酸和配体的关键。

AlphaFold 3 在药物研发上比 docking 软件更好吗?

在预测蛋白-配体结合构象上,AlphaFold 3 报告的准确率高于经典 docking 工具,而且无需被告知结合位点。但它预测的是几何结构,而非结合亲和力或动力学,因此在药物研发流程中它是 docking、实验和分子动力学的补充,而非替代。

AlphaFold 3 开源吗?

不像 AlphaFold 2 那样开源。发布时完整模型和权重并未自由公开,访问要通过带用量限制的免费 AlphaFold Server,这一点因限制独立复现而受到批评。

AlphaFold 3 把问题从”这个蛋白长什么样”重新定义为”这套分子系统如何组合在一起”——比起任何单一分数,正是这一转变让它重要。原文见 Nature