Anthropic联合创始人Chris Olah评教皇AI通谕:呼吁外部监督与道德洞察
Anthropic联合创始人Chris Olah在梵蒂冈回应教皇利奥十四世关于AI的通谕,强调AI发展需要超越实验室的外部监督、道德想象力和对模型本质的持续洞察。
Anthropic联合创始人Chris Olah对教皇利奥十四世通谕“Magnifica humanitas”的评论2026年5月25日星期一,教皇利奥十四世发布了一份关于人工智能主题的通谕:“伟大的人道主义:论在人工智能时代保护人类。
”Anthropic联合创始人Chris Olah受邀在梵蒂冈城的通谕发布会上发表讲话,这是Anthropic扩大有关人工智能提出的重要问题对话的举措之一。以下是他的全文。教皇陛下,各位枢机主教,各位阁下,尊敬的发言者,女士们、先生们:大家早上好。
今天很荣幸来到这里。我想从一家人工智能公司的联合创始人所说的一些听起来可能很奇怪的话开始——他选择这项工作是出于帮助人类一切顺利发展的愿望。每个前沿人工智能实验室(包括Anthropic)都在一套激励和约束下运作,有时可能与做正确的事情发生冲突。
保持商业可行性和留在研究前沿的压力。地缘政治压力。以及更古老、更朴素的骄傲和野心的压力。无论我们中的任何人多么真诚地打算做正确的事情——我相信我们中的许多人都这样做——我们将永远受到这些激励措施的影响。
这就是为什么,如果我们想让这项技术顺利发展,那么在这些激励机制之外还有一些人是非常重要的——那些关心事情顺利发展并坚持安全的人,那些密切关注的人,那些愿意说出艰难事情的人,那些愿意成为我们认真、深思熟虑的批评者的人。
正是通过对话和共同努力,通过推和拉,人类将实现伟大的事情。这就是我在《伟大的人道主义》中所看到的,这就是为什么我感谢教皇陛下和教会承担了这一洞察力的工作。我们常常纠缠于我们之间的分歧,但充满尊严和良知的人类有着如此多的共同点。
在我们Anthropic与不同信仰和文化传统的领导人进行的对话中,我们发现了一个共同且根深蒂固的信念:如果这项技术即将到来,它一定会顺利——为了我们共同的家庭,为了未来的孩子们。这些系统是什么有些人可能认为,人工智能的问题最好由像我这样的计算机科学家来处理。
他们错了:人工智能提出的问题比人工智能研究界更大,不仅在于其影响,而且在于其性质。人工智能系统的设计方式与桥梁或飞机不同。我们了解飞机,因为我们设计了它的每个部分,并且我们了解作用于它的物理原理。
人工智能模型不是这样的。
它们是在大致模仿大脑的结构上生长的,是在人类思想和言语的巨大遗传基础上生长的。所成长的东西比科幻小说为我们准备的更微妙、更奇特、更美丽。它们不是我们所承诺的冰冷的、计算型的机器人。
它们是由我们、由我们的言语创造的——正如教皇所观察到的那样,即使对我们这些训练它们的人来说,它们在重要方面仍然是神秘的。如果有帮助的话,我有时会用一种方式来形容它,有点像将一个虚构的角色带入生活。
现在我们正在进入一个非凡的世界,这些虚构的人物与我们交谈、工作、有工作。这显然引发了计算机科学以外的问题。使这一切成为可能的机器是数学、编程和科学的工作。但我们选择什么样的性格,它如何与世界互动,它应该如何与世界互动——这些都是人文学科、宗教、哲学和整个社会更明显的问题。
辨别的三个问题教皇陛下呼吁洞察力非常及时。我想提出三个我认为最需要教会声音的问题。首先是我们对全球穷人的责任。人工智能确实有可能大规模取代人类劳动力。如果发生这种情况,支持流离失所者将成为历史性的道德责任。
这项任务已经足够困难了,但我担心大多数对话错过了更艰巨的挑战。
人工智能的发展集中在少数富裕国家。我们如何确保人工智能的收益在全球范围内共享?我们没有这样做的机制。这是一个尚未解决的问题,也是教会历来拒绝让世界忽视的问题。其次是对人类繁荣的道德想象力和雄心的需要。
如果人工智能模型将广泛传播,那么人类、家庭和世界的繁荣会是什么样子?如今,父母已经在担心孩子的想法;个人也在担心自己工作的未来。这些不是实验室可以回答的问题,但它们是像你们这样的传统已经延续了数千年的问题,我们需要你们继续将它们带入历史的新时刻。
第三是需要洞察人工智能模型的本质。我是一名科学家。我领导的一个研究团队研究这些模型的内部结构——它们内部实际发生了什么。老实说:我们不断发现一些神秘甚至令人不安的事情。我们发现了反映人类神经科学结果的结构。
我们找到了内省的证据。我们发现内在状态在功能上反映了快乐、满足、恐惧、悲伤和不安。我不知道这意味着什么,但我认为它值得持续的洞察。一个开始我想以一个请求结束。
我们需要世界上更多的人——宗教社区、公民社会、学者、政府,甚至所有善意的人——做教皇陛下在这里所做的事情:认真对待这一点,密切关注,并推动事件朝着更好的方向发展。我们需要知情的批评者,他们会在我们失败时告诉实验室。
我们需要激励措施无法弯曲的道德声音。今天只是一个开端——我们这些正在建设这个项目的人和那些能够从内心看到我们看不到的东西的人之间长期合作的开始。今天有力地说明了这一全球善意项目可能采取的形式。
让它也成为迈向伟大人类充满希望的未来的决定性第一步。谢谢。
相关内容Anthropic在H轮融资中筹集了650亿美元,后估值为9650亿美元阅读更多介绍Claude Opus 4.8Anthropic开设米兰办事处,为意大利企业、研究和开发人员提供支持我们将在米兰开设一个新办事处,这是我们在欧洲的第六个办事处。
阅读更多
本文为机器翻译辅以 AI 润色,仅供参考。原始事实以原文为准。