腾讯的微信团队整合Ray以部署大规模AI

realtime news   Jul 02, 2025 22:27  UTC 14:27

1 Min Read

腾讯的微信团队通过部署Ray(一个开源的分布式计算引擎)与Kubernetes一起,在其AI基础设施方面迈出了重要步伐。这一整合旨在根据Anyscale报道,高效且经济地解决大规模AI系统的部署挑战。

Ray在AI基础设施中的角色

负责该应用程序的微信团队面对了众多技术障碍,包括资源利用、部署复杂性和应用编排。团队寻找了一种能够满足其广泛AI计算需求的解决方案,这些需求涵盖内容推荐、产品运营和内容创建。

Ray由加州大学伯克利分校的RISELab开发,作为领先的分布式计算框架,逐渐获得关注。它通过直观的编程模型简化了分布式应用的开发,使微信团队能够高效管理大规模的AI工作负载。

挑战与解决方案

微信现有的基础设施在处理如光学字符识别(OCR)这样计算密集型任务时面临瓶颈,这些任务需要超过一百万个CPU内核。虽然P6n平台适合响应迅速的在线任务,但对于大规模部署来说既昂贵又复杂。另一方面,优化用于离线处理的Gemini平台在满足实时性能需求方面不足。

为克服这些挑战,微信开发了基于Ray的新AI计算引擎AstraRay。AstraRay提高了成本效率、高吞吐量并减少了部署的复杂性,从而能够在异构资源上实现可扩展的AI部署。

Ray的整合和影响

Ray整合到微信的基础设施中,使AstraRay得以开发,该引擎支持超大规模资源调度和高效部署。AstraRay在KubeRay的社区版本上增强了功能,包括支持数百万个节点和改善的资源利用。

通过利用Ray的能力,微信简化了其AI操作,减少了AI应用部署的复杂性并提高了性能。这次整合不仅优化了资源的使用,还为微信未来的AI开发做好了准备。

未来前景

随着AstraRay的成功部署,腾讯的微信已做好扩展其AI能力的准备。该项目始于一年前,并持续演变,在未来几年为更复杂的AI应用和创新奠定了基础。



Read More