斯坦福大学Das实验室通过NVIDIA DGX Cloud提升RNA折叠研究
realtime news Apr 11, 2025 16:14
斯坦福大学的Das实验室利用NVIDIA DGX Cloud推动RNA折叠研究,通过社区参与和尖端技术开发更精确的RNA模型。

斯坦福大学Das实验室在RNA折叠研究方面取得了显著进展,利用NVIDIA DGX Cloud的先进计算能力。该计划得到了NAIRR试点项目的支持,为实验室在三个月内提供了32个配备八块GPU的NVIDIA A100 DGX Cloud节点的访问权限。根据NVIDIA的说法,这种巨大的计算能力使实验室从小规模实验转向大规模分布式训练,促进了大型模型和数据集的训练。
以社区为驱动的研究
在Dr. Rhiju Das的领导下,Das实验室一直处于RNA研究的前沿。2020年,该实验室在应对Covid-19疫情时举办了OpenVaccine Kaggle比赛,并于2024年继续开展了Ribonanza比赛。这些举措旨在加速对RNA结构及其生物功能的理解。
RNA折叠研究的主要障碍之一是实验性RNA结构数据的稀缺。为克服这一难题,Das实验室开发了Eterna,这是一款允许用户设计RNA序列的众包游戏。这些序列在实验室中合成,并进行化学图谱实验以推断RNA结构。
创新策略
实验室的策略结合了多种创新方法:
- 众包数据采集: Eterna用于从公众收集新RNA序列,并辅以专家策划的数据库。
- 数据近似: 化学图谱实验生成的反应性剖面帮助近似RNA结构。
- 通过众包进行模型设计: 实验室通过Kaggle比赛测试各种模型架构和训练线路,并邀请社区参与。
此外,实验室开发了一种经过训练的强化学习模型来玩Eterna,加速了新序列的生成。该模型使用了4000个A100 GPU小时在NVIDIA DGX Cloud上,使用Q学习算法进行训练。
卓越的成果
Das实验室成功地策划了最大的RNA结构训练数据库。基础模型经过256个A100 GPU的训练,已开发出RibonanzaNet2,目前在RNA折叠任务中的表现达到了最先进水平。该模型现已向社区开放使用及微调。
2025年2月26日,实验室推出了斯坦福RNA 3D折叠Kaggle竞赛,提供7.5万美元的奖金池以鼓励进一步完善RibonanzaNet2进行RNA结构预测。该竞赛邀请参与者利用竞赛期间收集的实验RNA结构。
未来前景
Das实验室进行的研究在推进生物科学方面具有重要潜力,对医学、农业和生物技术具有影响。通过开发更精确的RNA模型,研究人员可以更好地理解疾病机制并创造更有效的治疗方法。
展望未来,Das实验室计划扩大其数据集和模型,利用NVIDIA DGX Cloud提供的更强大计算资源。他们的工作展示了众包和尖端技术在促进科学研究中的力量。
Image source: Shutterstock