Anthropic 宣布,客户现在可以在 Amazon Bedrock 中对公司最快且最具成本效益的模型 Claude 3 Haiku 进行微调。根据 Anthropic 的说法,这一新功能使企业能够定制模型的知识和能力,从而在处理特定任务时更加高效。
微调概览
微调是一种广泛使用的技术,通过创建针对特定工作流程的定制版本来增强模型性能。要微调 Claude 3 Haiku,用户需要准备一组高质量的提示-完成对,这些对是给定任务的理想输出。微调 API 目前处于预览阶段,使用这些数据创建一个定制的 Claude 3 Haiku 模型。企业可以通过 Amazon Bedrock 控制台或 API 测试和优化其定制模型,直到满足其性能目标并准备好部署。
优势
微调 Claude 3 Haiku 提供了以下几个优势:
- 在特定任务上的更好结果:通过编码公司和领域知识,提升分类和与定制 API 交互等领域特定操作的性能。
- 更快的速度和更低的成本:与 Sonnet 或 Opus 等其他模型相比,降低生产部署成本并实现更快的结果。
- 一致的品牌格式:生成符合特定要求的一致结构化输出,确保遵守监管和内部协议。
- 易用的 API:使各类公司无需广泛的内部 AI 专业知识即可高效创新。微调不需要深入的技术知识。
- 安全可靠:将专有训练数据保留在客户的 AWS 环境中,保持 Claude 3 模型家族的低风险有害输出。
Anthropic 通过在互联网论坛上调解在线评论展示了微调的有效性,将分类准确率从 81.5% 提升至 99.6%,每次查询的 Token 数减少了 85%。
客户聚焦
韩国最大的电信运营商之一 SK 电讯,已经训练了一款定制的 Claude 模型,通过利用其行业特定的专业知识来改进支持工作流程和提升客户体验。AI 技术合作集团副总裁 Eric Davis 指出,代理响应的正面反馈增加了 73%,与电信相关任务的关键性能指标改善了 37%。
全球内容和技术公司 Thomson Reuters 也在 Claude 3 Haiku 上看到了积极的结果。Thomson Reuters 的 AI 和实验室负责人 Joel Hron 强调,公司希望通过围绕行业专业知识和具体需求微调 Claude 来提供准确、快速、一致的用户体验。Hron 预计 AI 结果将在速度和可衡量的改进上见效。
如何开始
Amazon Bedrock 中的 Claude 3 Haiku 微调目前在美国西部(俄勒冈)AWS 区域提供预览。最初支持基于文本的微调,最大上下文长度可达 32K Token,未来计划引入视觉能力。更多详细信息可以在 AWS 推出博客 和 文档中找到。
要请求访问,请联系您的 AWS 客户经理或在 AWS 管理控制台 中提交支持票。
Image source: Shutterstock