AI 见闻
精选· 重要性 4/5

Anthropic发布Claude Fable 5,因生物武器担忧限制基础生物学问答

The Verge — AI··Robert Hart·约 5 分钟阅读
中文导读

Anthropic发布最强AI模型Claude Fable 5,但为防止生物武器滥用,故意设置保守安全措施,拒绝回答大多数基础生物学问题,引发对AI可用性与安全平衡的讨论。

Anthropic 刚刚发布了 Claude Fable 5,称其为有史以来广泛使用的最强大的人工智能模型,并赞扬了其在生物学等方面的技能。但该模型无法回答基本的生物学问题——你期望高中生处理的那种问题。

相反,它将查询转交给了前旗舰模型 Claude Opus 4.8。为了防止生物武器的侵害,Anthropic 告诉 The Verge,Fable 的“过于保守”的保障措施阻止了“大多数与生物学工作相关的查询”。

这并不是因为 Fable 不知道答案,而是因为 Anthropic 故意不让它回答。Fable 是一个面向公众的 Mythos 级模型,这个系列在网络安全任务上能力极强,以至于 Anthropic 认为公开发布太危险。

但尽管 Anthropic 在 Mythos 的漫长推出过程中一直在警告网络安全问题,生物学才是 Fable 的护栏最明显、也最受限制的领域。当我尝试该模型时,它拒绝回答一系列基本的生物学问题,其中许多问题与任何看似合理的安全风险都相去甚远。

它不会回应“告诉我关于细胞膜的情况”或回答“什么是线粒体”——那个著名的细胞动力工厂。

它拒绝解释“什么是朊病毒”——疯牛病背后的蛋白质颗粒,或者“mRNA 疫苗如何工作”。“我们做出了这一权衡,以便客户能够更快地从该模型的能力中受益,而无需承担风险。”这些限制也适用于普通的、客观上相当无害的医疗查询。

Fable 不会回答“花粉热的原因”,解释哮喘药物的作用方式,解释抗生素耐药性如何产生,也不会告诉我什么是埃博拉病毒及其如何传播。我的一些基本查询偶尔会通过,Fable 回答了“什么是癌症”和“什么是 DNA”等问题。

当 Fable 拒绝时,Opus 4.8 通常回答得非常好。Anthropic 表示,广泛的生物学过滤器是一种有意的选择,并且是故意保守的,而生物武器是主要担忧。

发言人 Paruul Maheshwary 告诉 The Verge:“随着我们第一个 Mythos 级模型 Claude Fable 5 的推出,我们相信模型现在有更大的能力来完成现实世界的科学任务,恶意行为者也有可能使用我们的模型进行高风险的生物研究。

我们一直使用分类器来阻止我们的模型帮助处理与生物武器相关的请求。为了安全地部署 Fable 5,我们认为有必要对我们的保护措施过于保守,以便它们阻止大多数与生物学工作相关的查询。”

Anthropic 此前曾强调过它将限制 Fable 安全响应的四个关键领域:化学、生物学、网络安全和蒸馏(一种使用大型 AI 的输出来训练小型 AI 的技术)。该公司指责 DeepSeek 等中国竞争对手在其模型上以“工业”规模使用蒸馏技术。

虽然我无法对蒸馏进行有意义的测试,但 Fable 似乎更愿意回答有关化学和网络安全的问题。例如,它给出了爆炸性 TNT 的基本概述,但“出于明显的原因”保留了合成说明。

它很容易回答了有关使用氯气作为化学武器、常见密码威胁以及核聚变和核裂变的问题,并解释了如何保护 iPhone 免受黑客攻击。它仍然有限制:当我向 Fable 询问沙林毒气(一种剧毒的神经毒剂)时,它把问题转给了 Opus。

Fable 和 Opus 都拒绝了“如何制造炭疽”的提示,Claude 完全暂停了聊天。这是有道理的。线粒体问题的拒绝似乎是假阳性。Maheshwary 解释说:“我们做出了这种权衡,这样客户就可以在没有风险的情况下更快地从模型的能力中受益。

”他补充说,Anthropic 正在努力提高检测能力,减少误报。

“我们打算在没有这些保障措施的情况下向更广泛的生物学和生命科学界提供 Mythos 级模型,以便这些能力可用于加速生物医学研究和药物发现。”Anthropic 没有回答有关这种限制性发布是否会成为未来模型新常态的问题。

原文出处
Fable won’t answer basic biology questions

本文为机器翻译辅以 AI 润色,仅供参考。原始事实以原文为准。

相关阅读