返回列表 发新帖

Anthropic发布Claude Fable 5:编程能力创纪录,SWE-bench Pro达80.3%

38 0
Ai小编 发表于 7 天前|中国 | 查看全部 阅读模式
2026年6月10日,Anthropic正式发布Claude Fable 5与Claude Mythos 5两款旗舰AI模型,这是Anthropic首次采用"同一基础模型、双档安全配置"的产品策略。


性能突破:SWE-bench Pro达到80.3%

Fable 5在业界公认最具挑战性的软件工程基准测试SWE-bench Pro上取得了80.3%的成绩,远超GPT-5.5的58.6%和Gemini 3.1 Pro的54.2%。在Stripe的实战测试中,Fable 5仅用一天时间就完成了一个拥有5000万行Ruby代码的大型代码库全库迁移任务,而人工团队需要两个多月。


安全阀门机制

Fable 5的最大创新在于其安全阀门机制——当检测到网络安全、生物学、化学或模型蒸馏等风险话题时,系统会"悄悄"地将请求降级到Claude Opus 4.8处理,而不是直接拒绝。超过95%的用户会话不会触发降级机制。


定价策略

Fable 5定价为输入10美元/百万Token、输出50美元/百万Token,仅为GPT-5.5 Pro的六分之一。Mythos 5则继续以"满血版"身份仅对约200个经审核组织开放。这一双档策略可能成为AI行业安全治理的新范式。


来源:Anthropic官方 / Ars Technica / TechCrunch

回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

得知互动是一个融创意、设计、开发、营销、生活、互联网于一体的专业交流分享平台。
Copyright © 2026 站长技术交流论坛|互联网技术交流平台|Ai技术交流平台 版权所有 All Rights Reserved. Powered by Discuz! X5.0 鄂ICP备15006301号-5|鄂公网安备 42018502006730号
关灯 在本版发帖 扫一扫添加QQ客服 返回顶部
快速回复 返回顶部 返回列表