Claude新模型Opus 4.8更“诚实”，出错时主动承认

The Verge — AI·大约 2 个月前·Jay Peters·约 2 分钟阅读

Anthropic即将发行Claude Opus 4。周四8点，该公司正在宣传这位模特的“诚实”。”克劳德的新模式在搞砸时更加“诚实”作品4。8号将于周四发射。作品4。8号将于周四发射。

根据Anthropic的说法，它训练“所有[它的]模型都是诚实的-例如，避免做出他们无法支持的声明。但它指出，“人工智能模型的一个普遍问题是，它们有时会仓促下结论，尽管证据不足，但自信地将他们的工作描述为正在取得进展。

”人工智能实验室声称早期测试人员发现Opus 4. 8”更有可能表明其工作的不确定性，并且不太可能提出无根据的主张。“在公司的评估中，作品4。8是“大约4倍的可能性比它的前身，以允许在代码中的缺陷，它的书面通过未标记。

”除了诚实的改进，作品4。8、用户可以指导克劳德投入到一项任务中的努力量。更高的努力响应将使用更多的令牌，如果用户不想很快耗尽他们的速率限制，他们可以选择更低的努力响应。

Anthropic还在研究预览中推出了一项名为“动态工作流程”的功能，该公司表示这将让Claude“承担更大的任务”。“通过动态工作流程”，Claude可以计划工作，然后在单个会话中运行数百个并行子代理（以及Opus 4. 8、代理可以运行更长时间）。

然后在向用户报告之前验证其输出。”

原文出处

本文为机器翻译辅以 AI 润色，仅供参考。原始事实以原文为准。

相关阅读