Boltz:革新生物分子相互作用预测的模型家族
引言
在生物分子研究领域,准确预测生物分子间的相互作用一直是科学家们追求的目标。这对于药物研发、理解生物过程等方面都有着至关重要的意义。而 Boltz 模型家族的出现,为这一领域带来了新的突破和希望。本文将详细介绍 Boltz 模型家族,包括其特点、安装方法、使用方式以及未来的发展方向等内容,让你对这个前沿的模型有更深入的了解。
什么是 Boltz 模型家族?
Boltz 是一系列用于生物分子相互作用预测的模型。其中,Boltz – 1 是第一个接近 AlphaFold3 精度的完全开源模型。而最新的 Boltz – 2 则更进一步,它是一种新型的生物分子基础模型,不仅超越了 AlphaFold3 和 Boltz – 1,还能联合建模复杂结构和结合亲和力,这对于精确的分子设计来说是一个关键的组成部分。
Boltz – 2 的独特优势
Boltz – 2 是第一个在精度上接近基于物理的自由能微扰(FEP)方法的深度学习模型,更令人惊喜的是,它的运行速度比 FEP 方法快 1000 倍。这一优势使得在早期药物发现阶段进行精确的计算机模拟筛选变得切实可行。
模型资源获取与许可
代码和权重的获取
所有的代码和权重都以 MIT 许可证提供,这意味着无论是学术研究还是商业应用,都可以免费使用这些资源。你可以通过以下两种方式获取 Boltz 的代码:
-
通过 PyPI 安装(推荐):这种方式简单便捷,只需要在命令行中输入以下命令即可:
pip install boltz -U
-
从 GitHub 直接下载:如果你希望获取每日更新的版本,可以从 GitHub 克隆代码库,具体步骤如下:
git clone https://github.com/jwohlwend/boltz.git
cd boltz; pip install -e .
引用说明
如果你在研究中使用了 Boltz 的代码或模型,需要引用以下两篇论文:
@article{passaro2025boltz2,
author = {Passaro, Saro and Corso, Gabriele and Wohlwend, Jeremy and Reveiz, Mateo and Thaler, Stephan and Somnath, Vignesh Ram and Getz, Noah and Portnoi, Tally and Roy, Julien and Stark, Hannes and Kwabi - Addo, David and Beaini, Dominique and Jaakkola, Tommi and Barzilay, Regina},
title = {Boltz - 2: Towards Accurate and Efficient Binding Affinity Prediction},
year = {2025},
doi = {},
journal = {}
}
@article{wohlwend2024boltz1,
author = {Wohlwend, Jeremy and Corso, Gabriele and Passaro, Saro and Getz, Noah and Reveiz, Mateo and Leidal, Ken and Swiderski, Wojtek and Atkinson, Liam and Portnoi, Tally and Chinn, Itamar and Silterra, Jacob and Jaakkola, Tommi and Barzilay, Regina},
title = {Boltz - 1: Democratizing Biomolecular Interaction Modeling},
year = {2024},
doi = {10.1101/2024.11.19.624167},
journal = {bioRxiv}
}
此外,如果你使用了自动多序列比对(MSA)生成功能,还需要引用以下论文:
@article{mirdita2022colabfold,
title={ColabFold: making protein folding accessible to all},
author={Mirdita, Milot and Sch{\"u}tze, Konstantin and Moriwaki, Yoshitaka and Heo, Lim and Ovchinnikov, Sergey and Steinegger, Martin},
journal={Nature methods},
year={2022},
}
安装 Boltz
环境建议
在安装 Boltz 之前,建议你在一个全新的 Python 环境中进行操作,这样可以避免与其他已安装的库产生冲突。
安装步骤
方法一:使用 PyPI 安装
这是最推荐的安装方式,只需要打开命令行终端,输入以下命令:
pip install boltz -U
这个命令中的 -U
选项表示如果已经安装了 Boltz,会将其更新到最新版本。
方法二:从 GitHub 安装
如果你希望获取最新的开发版本,或者想要参与代码的开发和贡献,可以从 GitHub 克隆代码库并进行安装。具体步骤如下:
-
克隆代码库:在命令行中输入以下命令,将 Boltz 的代码库克隆到本地:
git clone https://github.com/jwohlwend/boltz.git
-
进入代码目录:使用 cd
命令进入克隆下来的代码目录:
cd boltz
-
安装代码:在代码目录中,使用以下命令进行安装:
pip install -e .
这里的 -e
选项表示以可编辑模式安装,这样在你对代码进行修改后,不需要重新安装就可以生效。
使用 Boltz 进行推理
基本命令
安装完成后,你可以使用以下命令运行 Boltz 进行推理:
boltz predict input_path --use_msa_server
参数说明
-
input_path
:这个参数应该指向一个 YAML 文件,或者一个包含 YAML 文件的目录。如果指向目录,Boltz 会对目录中的所有 YAML 文件进行批量处理。这些 YAML 文件描述了你想要建模的生物分子以及你想要预测的属性(例如亲和力)。 -
--use_msa_server
:这个选项表示使用多序列比对(MSA)服务器。
查看可用选项
如果你想查看所有可用的选项,可以使用以下命令:
boltz predict --help
输入格式说明
关于这些输入格式的更多信息,可以参考 预测说明文档。默认情况下,boltz
命令会运行最新版本的模型。
Boltz 的评估和训练
评估
目前,关于 Boltz – 2 的更新评估代码即将推出。为了鼓励可重复性研究,并便于与其他模型进行比较,除了现有的 Boltz – 1 评估管道外,未来还将提供 Boltz – 2、Boltz – 1、Chai – 1 和 AlphaFold3 在测试基准数据集上的评估脚本和结构预测结果,以及在 FEP + 基准、CASP16 和 MF – PCBA 测试集上的亲和力预测结果。
训练
同样,Boltz – 2 的更新训练代码也即将推出。如果你对重新训练模型感兴趣,目前可以参考 训练说明文档 来了解 Boltz – 1 的训练方法,未来也将支持 Boltz – 2 的训练。
社区参与和硬件支持
社区参与
Boltz 团队欢迎外部贡献,并渴望与社区进行互动。你可以加入他们的 [Slack 频道](https://join.slack.com/t/boltz – community/shared_invite/zt – 34qg8uink – V1LGdRRUf3avAUVaRvv93w),在那里你可以与团队成员和其他研究者讨论模型的进展、分享见解,并促进围绕 Boltz – 2 的合作。
硬件支持
值得一提的是,Boltz 还可以在 Tenstorrent 硬件上运行,这得益于 Moritz Thüning 的 [分叉版本](https://github.com/moritztng/tt – boltz)。
FAQ
1. Boltz 模型家族适用于哪些领域?
Boltz 模型家族主要适用于生物分子相互作用预测领域,在药物研发、理解生物过程等方面有着重要的应用。例如,在药物研发的早期阶段,通过预测生物分子的结合亲和力,可以筛选出更有潜力的药物分子。
2. 安装 Boltz 需要注意什么?
建议在全新的 Python 环境中安装 Boltz,以避免与其他已安装的库产生冲突。可以使用 PyPI 或从 GitHub 直接下载安装,具体安装步骤可参考本文的安装部分。
3. 如何使用 Boltz 进行推理?
使用 boltz predict input_path --use_msa_server
命令进行推理,其中 input_path
指向 YAML 文件或包含 YAML 文件的目录。若想查看所有可用选项,可使用 boltz predict --help
命令。更多输入格式信息可参考 预测说明文档。
4. 能否在研究中使用 Boltz 的代码和模型?
可以,Boltz 的代码和模型以 MIT 许可证提供,可用于学术和商业用途。但在研究中使用时,需要按照要求引用相关论文。
5. 关于 Boltz – 2 的评估和训练代码何时推出?
文中提到评估和训练代码即将推出,但具体时间未明确说明。你可以关注 Boltz 的官方渠道或 Slack 社区,以获取最新消息。
6. 如何参与 Boltz 社区?
你可以加入 [Slack 频道](https://join.slack.com/t/boltz – community/shared_invite/zt – 34qg8uink – V1LGdRRUf3avAUVaRvv93w),在那里与团队成员和其他研究者交流,分享见解并促进合作。
7. Boltz 可以在哪些硬件上运行?
Boltz 可以在常见的计算硬件上运行,此外,得益于 Moritz Thüning 的 [分叉版本](https://github.com/moritztng/tt – boltz),它还可以在 Tenstorrent 硬件上运行。
总结
Boltz 模型家族为生物分子相互作用预测领域带来了新的活力和突破。Boltz – 1 作为首个接近 AlphaFold3 精度的完全开源模型,为后续的研究奠定了基础。而 Boltz – 2 更是在精度和速度上取得了显著的提升,使得精确的计算机模拟筛选在早期药物发现中变得切实可行。通过免费的代码和权重资源,以及社区的积极参与,Boltz 有望在生物分子研究领域发挥更大的作用。虽然目前 Boltz – 2 的评估和训练代码还未完全推出,但我们有理由期待它未来的表现。无论是科研人员还是相关行业的从业者,都可以关注 Boltz 模型家族的发展,并在合适的场景中应用它,为生物分子研究和药物研发贡献力量。