教皇通谕被指部分由AI撰写,检测工具引发争议
分析显示,教皇利奥十四世关于AI风险的最新通谕《Magnifica Humanitas》部分段落可能由AI生成,引发对AI写作与检测可靠性的讨论。
人工智能可能被用来撰写教皇利奥十四世关于人工智能对人类影响的最新通谕的部分内容。
根据流行的人工智能检测器Pangram,Linch Zhang在LessWrong论坛上发布的一项分析发现,《Magnifica Humanitas》的某些段落有40%到100%是由人工智能撰写的。
教皇是否使用人工智能来撰写关于人工智能危险的内容?分析确定《Magnifica Humanitas》的部分内容似乎是由人工智能撰写的。该文件包含了AI生成写作中出现的已知特征,例如比之前的通谕更高频地使用“真正”一词——该词出现在Anthropic的Claude的写作中。
另一个人在Pangram中逐节运行该文档的文本,发现第一章有62%的内容被标记为AI生成。当The Verge通过Pangram运行大约2000字的文档时,估计46%是AI编写的。AI检测并非万无一失。
尽管如此,其他部分仍被判定为由人类撰写。张指出,Pangram将某些部分标记为“基本上0% AI”。最后四篇通谕的前20段在Pangram中运行时,被100%确信为人类撰写。教皇利奥的演讲文字记录在Pangram中也被评为100%人类。
AI检测并非万无一失。
不同的人工智能检测器可能显示不同的结果,即使达成共识,也不能保证它们正确。但Pangram在人工智能研究人员中普遍受到尊重。2025年3月,Pangram表示,其将人类撰写作品误报为AI生成的假阳性率“约为万分之一”。
据《纽约时报》报道,通谕是教皇发布的长篇信件,旨在传授解决当时重要道德和社会挑战的教义。这份通谕是教皇的第一份通谕,最近一份通谕由教皇方济各于2024年10月撰写。
它也是第一个关注人工智能及其广泛影响的通谕,教皇利奥与Anthropic的联合创始人Christopher Olah一同发布了它。梵蒂冈没有立即回复置评请求。