AI 见闻
精选· 重要性 4/5

Anthropic发布Opus 4.8,新增动态工作流工具

TechCrunch — AI··Russell Brandom·约 2 分钟阅读
中文导读

Anthropic推出最新旗舰模型Opus 4.8,升级周期缩短至41天,新增动态工作流功能以管理复杂任务,同时更善于标记不确定性。

周四,Anthropic发布了其最先进公开模型的最新版本Opus 4.8。该模型现已全面上线,标准定价与上一版Opus相同。新模型距离Opus 4.7发布仅41天,升级周期远快于Anthropic的正常节奏(最近的Sonnet和Haiku模型分别已有三个月和七个月)。

快速迭代可能与Opus 4.7反响冷淡有关,部分用户对其感到失望。在此期间,OpenAI的Codex和Google的Gemini Flash模型也发布了重要新版本,加大了Anthropic保持竞争力的压力。

Opus 4.8在基准测试中取得了预期的一流结果,但更受关注的是它如何处理不良或不确定数据。在发布博文中,Anthropic的早期测试人员发现,新模型“更倾向于标记其工作中的不确定性,且不太可能提出未经证实的主张。

”桥水基金的一份推荐信也呼应了这一点,称升级的最大区别在于“Opus 4.8倾向于主动标记分析输入和输出中的问题,而其他模型通常会忽略这些问题,留给用户去发现。”与新模型一同发布的还有一项名为“动态工作流”的功能,该功能将以研究预览形式提供。

该系统旨在帮助Opus等大型模型管理涉及数百个并行子代理的复杂任务。博文解释道:“Claude Code与Opus 4.8现在可以以现有测试套件为标准,从启动到合并,跨数十万行代码执行代码库规模的迁移。

”在上个月的初步预览引发网络安全担忧后,Anthropic仍暂未发布其最先进的Mythos模型。但该公司在今天的Opus发布中暗示,一旦必要的安全措施完成,Mythos预览期可能很快结束。

公司写道:“我们在开发这些安全措施方面进展迅速,预计在未来几周内能够为所有客户提供Mythos级别的模型。”

原文出处
Anthropic releases Opus 4.8 with new ‘dynamic workflow’ tool

本文为机器翻译辅以 AI 润色,仅供参考。原始事实以原文为准。

相关阅读