Together AI携手Cartesia Sonic推出低延迟语音AI平台
realtime news Jan 25, 2025 09:48
Together AI推出Together Audio API,利用Cartesia Sonic的低延迟、多语言语音模型,使开发者能够在多个行业中创建先进的语音应用。

Together AI宣布推出其Together Audio API,该API由Cartesia Sonic驱动,采用尖端的低延迟和超逼真的语音模型。通过这次合作,开发者可以直接通过Together API访问Sonic模型,提供对多种声音和语言的支持。据Together AI称,这一举措扩展了平台的功能,能够在单一平台上创建集成聊天、图像、音频等的多模态应用。
关键特性与合规性
Together Audio API由Cartesia Sonic支持,拥有最先进的低延迟和超逼真的语音能力。开发者可以在Together平台上构建企业级语音应用,该平台符合HIPAA和SOC2标准。平台还提供食谱帮助开发者入门,例如使用代理工作流创建NotebookLM风格的播客。
构建多模态应用
音频功能的引入标志着Together AI的一个重要里程碑,旨在使开发者能够构建和编排多模态应用。这些应用可以通过Together API平台集成多个AI模型,包括聊天、图像、音频和代码。该平台允许无缝编排如语音转文本、大语言模型和文本转语音的AI模型,确保最低延迟且无需多个API提供商。
语音AI使用案例
语音AI正在变革各个行业,85%的公司预计将在未来五年内广泛部署。开发者可以利用语音功能进行AI驱动的客户支持、内容创建和个性化语音助手。例如,将LLMs与Sonic的自然响应结合可以增强客户查询,而AI可以自动化播客和媒体的音频内容制作。
为何选择Cartesia Sonic?
在盲人优选测试中,Cartesia Sonic优于其他语音模型,提供超低延迟和卓越的内容处理功能。Sonic的流媒体延迟仅为90毫秒,提供最快的端到端语音应用。它擅长处理复杂输入,并在Cartesia创新的状态空间模型架构下提供15种语言的多样化语音选项。
开始使用
有兴趣构建语音AI的开发者可以加入Together AI的Discord开发者社区,分享项目和想法。Together Audio API和Cartesia Sonic提供了创建先进语音应用的机会,提升各行业的用户体验。
Image source: Shutterstock