ElevenLabs 推出语音设计API和X到语音项目 - Blockchain.News

ElevenLabs 推出语音设计API和X到语音项目

realtime news Nov 01, 2024 16:51

ElevenLabs推出语音设计API和X到语音项目,使用户能够从提示或Twitter个人资料创建独特的声音,扩展了语音合成的可能性。

ElevenLabs 推出语音设计API和X到语音项目

根据ElevenLabs,该公司推出了新的语音设计API,这是一种允许用户根据提示生成独特声音的工具。这个创新的功能使得可以创造具有特定特征的声音,如年龄、口音和语气,甚至是像食人魔、女巫和海盗一样的幻想声音。

API功能和能力

语音设计API提供了两个主要端点。第一个端点根据文本提示生成三个独特的语音预览,为用户提供多种选择。第二个端点允许用户将这些语音预览保存到他们的库中,提供了对语音自定义的灵活性和控制。

X到语音项目

为了展示语音设计API的潜力,ElevenLabs开发了X到语音项目。这个演示项目根据用户的X(前身为Twitter)个人资料创建一个独特的声音和头像。通过分析用户的资料,该工具生成个性化的声音,展示了API将社交媒体数据整合到语音合成中的能力。

开源贡献

ElevenLabs还将X到语音项目作为开源示例提供。开发者可以在GitHub上访问该项目,允许他们探索和扩展演示中展示的能力。此举旨在推动创新,并鼓励利用语音设计API开发新应用程序。

语音设计API的发布标志着语音合成技术的重大进步,为开发者和用户提供了创建高度个性化和多样化语音输出的工具。随着社交媒体个人资料集成功能的加入,各个行业的应用可能性广阔且充满希望。

Image source: Shutterstock