克劳德的新模式在搞砸时更加“诚实”
The Verge — AI··Jay Peters·约 2 分钟阅读
Anthropic即将发行Claude Opus 4。周四8点,该公司正在宣传这位模特的“诚实”。”克劳德的新模式在搞砸时更加“诚实”作品4。8号将于周四发射。作品4。8号将于周四发射。
根据Anthropic的说法,它训练“所有[它的]模型都是诚实的-例如,避免做出他们无法支持的声明。但它指出,“人工智能模型的一个普遍问题是,它们有时会仓促下结论,尽管证据不足,但自信地将他们的工作描述为正在取得进展。
”人工智能实验室声称早期测试人员发现Opus 4. 8”更有可能表明其工作的不确定性,并且不太可能提出无根据的主张。“在公司的评估中,作品4。8是“大约4倍的可能性比它的前身,以允许在代码中的缺陷,它的书面通过未标记。
”除了诚实的改进,作品4。8、用户可以指导克劳德投入到一项任务中的努力量。更高的努力响应将使用更多的令牌,如果用户不想很快耗尽他们的速率限制,他们可以选择更低的努力响应。
Anthropic还在研究预览中推出了一项名为“动态工作流程”的功能,该公司表示这将让Claude“承担更大的任务”。“通过动态工作流程”,Claude可以计划工作,然后在单个会话中运行数百个并行子代理(以及Opus 4. 8、代理可以运行更长时间)。
然后在向用户报告之前验证其输出。”