Anthropic宣布推出Claude 3.5 Sonnet,这是其新Claude 3.5模型家族中的首款模型。根据Anthropic介绍,Claude 3.5 Sonnet在各种评估中显著优于竞争对手模型及其前身Claude 3 Opus,同时保持了中端模型Claude 3 Sonnet的速度和成本。
增强的性能与可访问性
Claude 3.5 Sonnet现在可以在Claude.ai和Claude iOS应用上免费使用,Claude Pro和团队计划订阅者享有更高的速率限制。该模型还可以通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI获取。其费用为每百万输入代币3美元,每百万输出代币15美元,具有200K代币上下文窗口。
双倍速度的前沿智能
Claude 3.5 Sonnet在研究生级别推理、本科级别知识和编程能力方面设定了新的标准。它擅长理解细微差别、幽默和复杂指令,并特别善于以自然语调生成高质量内容。其操作速度是Claude 3 Opus的两倍,适用于上下文敏感的客户支持和多步骤工作流程的协调任务。
在一次内部代理编程评估中,Claude 3.5 Sonnet解决了64%的问题,而Claude 3 Opus解决了38%的问题。该评估测试模型根据自然语言描述修复错误或添加功能到开源代码库的能力。配备相关工具后,Claude 3.5 Sonnet可以独立编写、编辑和执行代码,使其在更新遗留应用程序和迁移代码库方面效果显著。
最先进的视觉能力
Claude 3.5 Sonnet在标准视觉基准测试中超越了Claude 3 Opus,在解释图表和图形等需要视觉推理的任务中表现出众。它还可以准确地从不完美的图像中转录文本,这对零售、物流和金融服务等行业至关重要。
引入Artifacts
Anthropic还在Claude.ai上引入了一项名为Artifacts的新功能,允许用户在专用窗口中生成和交互代码片段和文本文档。此功能将Claude从对话式AI转变为协作工作环境,未来更新将支持团队协作。
对安全和隐私的承诺
Claude 3.5 Sonnet经过严格测试以防止滥用,根据红队评估仍处于ASL-2级别。该模型由外部专家评估,包括英国人工智能安全研究所(UK AISI)和美国人工智能安全研究所(US AISI),确保了强大的安全机制。Anthropic整合了儿童安全专家Thorn的反馈,更新了其分类器和模型进行微调。
隐私仍然是核心原则,除非用户明确允许,否则不会使用用户提交的数据进行训练。
未来发展
Anthropic计划在今年晚些时候发布Claude 3.5家族的其他模型,包括Claude 3.5 Haiku和Claude 3.5 Opus。公司还在开发新功能,以支持更多商业用例,如企业应用集成和个性化用户体验。
鼓励用户提供关于Claude 3.5 Sonnet的反馈,以帮助未来的开发和改进。
Image source: Shutterstock