NEW
NVIDIA的Evo 2通过先进的AI革新基因组建模 - Blockchain.News

NVIDIA的Evo 2通过先进的AI革新基因组建模

realtime news Feb 20, 2025 10:20

NVIDIA的Evo 2在基因组建模领域引入了突破性进展,利用AI分析和生成跨物种的生物分子序列,提升了生物研究和应用。

NVIDIA的Evo 2通过先进的AI革新基因组建模

NVIDIA推出了Evo 2,这是一款先进的AI模型,通过分析和生成生物分子序列,以前所未有的规模显著增强了基因组建模。根据NVIDIA的博客,这一发展基于其前身Evo的成功,标志着生物研究新时代的开始。

基因组建模的进展

Evo 2利用了一个包含8.85万亿核苷酸的数据集,这些数据来自超过128,000个基因组,跨越生命的三个领域:真核生物、原核生物和古生菌。这个庞大的训练数据使Evo 2能够实现跨物种的泛化,与其前身Evo模型相比,这是一个显著的改进,原模型仅限于原核基因组。

该模型采用了增强的StripedHyena 2架构,支持多达400亿参数,并能处理长达100万个令牌的上下文长度。该架构旨在高效管理长序列,优于传统依赖注意力机制的模型。

应用和能力

Evo 2的能力扩展到各种生物应用,包括变异影响分析、基因必需性识别以及复杂生物系统的设计。其零样本性能允许对突变效应和基因组注释的准确预测,为人类疾病、农业和环境科学提供了无价的见解。

模型的生成能力使得原核和真核序列的设计,以及染色质可及性成为可能,展示了其在合成生物学和精准医学中实际应用的潜力。

技术创新和训练

Evo 2在NVIDIA DGX Cloud上使用2,048台NVIDIA H100 GPU进行训练,这强调了NVIDIA与Arc Institute的合作。该高性能平台促进了大规模、分布式训练,优化了模型性能,加速了基因组研究的进展。

NVIDIA Evo 2 NIM微服务提供了一个用于生成生物序列的API,提供了调整令牌化和采样等参数的设置。此服务允许研究人员为特定任务微调Evo 2,进一步扩展其在BioPharma及其他领域的实用性。

AI在生物学中的未来

Evo 2代表了AI驱动的生物研究的重大飞跃,为未来的创新奠定了基础。其高精度和广泛适用性分析和生成生物分子序列的能力凸显了其在转变基因组学和合成生物学领域的潜力。

随着AI的不断发展,像Evo 2这样的模型将在解码生命复杂性和设计新生物系统中发挥重要作用,与AI驱动的科学研究的广泛趋势保持一致。Evo 2取得的进步预示着一个充满希望的未来,在这个未来中,AI将成为生物发现和创新的必不可少的工具。

欲了解更多详情,请访问NVIDIA博客

Image source: Shutterstock