ElevenLabs 推出语音设计API和X到语音项目

NEW

ElevenLabs 推出语音设计API和X到语音项目 - Blockchain.News

根据ElevenLabs，该公司推出了新的语音设计API，这是一种允许用户根据提示生成独特声音的工具。这个创新的功能使得可以创造具有特定特征的声音，如年龄、口音和语气，甚至是像食人魔、女巫和海盗一样的幻想声音。

API功能和能力

语音设计API提供了两个主要端点。第一个端点根据文本提示生成三个独特的语音预览，为用户提供多种选择。第二个端点允许用户将这些语音预览保存到他们的库中，提供了对语音自定义的灵活性和控制。

为了展示语音设计API的潜力，ElevenLabs开发了X到语音项目。这个演示项目根据用户的X（前身为Twitter）个人资料创建一个独特的声音和头像。通过分析用户的资料，该工具生成个性化的声音，展示了API将社交媒体数据整合到语音合成中的能力。

ElevenLabs还将X到语音项目作为开源示例提供。开发者可以在GitHub上访问该项目，允许他们探索和扩展演示中展示的能力。此举旨在推动创新，并鼓励利用语音设计API开发新应用程序。

语音设计API的发布标志着语音合成技术的重大进步，为开发者和用户提供了创建高度个性化和多样化语音输出的工具。随着社交媒体个人资料集成功能的加入，各个行业的应用可能性广阔且充满希望。

Image source: Shutterstock