Together AI携手Cartesia Sonic推出低延迟语音AI平台

NEW

Together AI携手Cartesia Sonic推出低延迟语音AI平台 - Blockchain.News

Together AI宣布推出其Together Audio API，该API由Cartesia Sonic驱动，采用尖端的低延迟和超逼真的语音模型。通过这次合作，开发者可以直接通过Together API访问Sonic模型，提供对多种声音和语言的支持。据Together AI称，这一举措扩展了平台的功能，能够在单一平台上创建集成聊天、图像、音频等的多模态应用。

关键特性与合规性

Together Audio API由Cartesia Sonic支持，拥有最先进的低延迟和超逼真的语音能力。开发者可以在Together平台上构建企业级语音应用，该平台符合HIPAA和SOC2标准。平台还提供食谱帮助开发者入门，例如使用代理工作流创建NotebookLM风格的播客。

构建多模态应用

音频功能的引入标志着Together AI的一个重要里程碑，旨在使开发者能够构建和编排多模态应用。这些应用可以通过Together API平台集成多个AI模型，包括聊天、图像、音频和代码。该平台允许无缝编排如语音转文本、大语言模型和文本转语音的AI模型，确保最低延迟且无需多个API提供商。

语音AI使用案例

语音AI正在变革各个行业，85%的公司预计将在未来五年内广泛部署。开发者可以利用语音功能进行AI驱动的客户支持、内容创建和个性化语音助手。例如，将LLMs与Sonic的自然响应结合可以增强客户查询，而AI可以自动化播客和媒体的音频内容制作。

为何选择Cartesia Sonic？

在盲人优选测试中，Cartesia Sonic优于其他语音模型，提供超低延迟和卓越的内容处理功能。Sonic的流媒体延迟仅为90毫秒，提供最快的端到端语音应用。它擅长处理复杂输入，并在Cartesia创新的状态空间模型架构下提供15种语言的多样化语音选项。

开始使用

有兴趣构建语音AI的开发者可以加入Together AI的Discord开发者社区，分享项目和想法。Together Audio API和Cartesia Sonic提供了创建先进语音应用的机会，提升各行业的用户体验。

Image source: Shutterstock