埃隆,别再试图让Grok发生了
埃隆·马斯克(Elon Musk)的“寻求真相”人工智能聊天机器人Grok有一个残酷的事实:它不是很好,而且使用它的人也不多。这是路透社一份新报道的结论,该报道发现Grok几乎没有出现在联邦记录中关于美国政府去年如何使用人工智能。
这并不是xAI标志性的聊天机器人陷入困境的唯一迹象,尽管马斯克将其置于可能是历史上最大的IPO的核心。埃隆,别再试图让Grok发生了新数据显示,政府工作人员不喜欢埃隆·马斯克的聊天机器人。有人吗?
新数据显示,政府工作人员不喜欢埃隆·马斯克的聊天机器人。有人吗?路透社审查了400多个政府人工智能使用的例子,其中列出了特定供应商。
研究发现,Grok或xAI只出现在三种产品中--每种产品都用于文档起草或社交媒体管理等基本用途,并且始终与微软和OpenAI等竞争对手并肩作战。相比之下,OpenAI的模型出现在230多个示例中,而Google和Anthropic各出现了数十次。
类似的模式出现在另一个数据库中,该数据库包含了更雄心勃勃、用户数量较少的政府人工智能项目。格罗克只出现过三次:两次在选举援助委员会执行例行行政任务,一次在劳伦斯·利弗莫尔国家实验室的能源部试点项目中进行文件摘要和一般研究。
路透社发现了140个涉及微软和OpenAI的条目,而我的简短评论发现了至少10个Anthropic条目和数十个谷歌Gemini的条目。这些名单是对政府采用情况的不完整且不完整的衡量标准。列出了更多示例,但没有具体的供应商,很明显,什么才算人工智能没有统一的定义。
这些数据也没有涵盖情报机构或五角大楼--xAI去年获得了一份2亿美元的合同,最近在Anthropic被列入黑名单后获准在机密网络上运营。尽管如此,Grok的情况看起来并不好。
它的出现量远低于其竞争对手,而且当它出现时,它主要是用于基本的行政工作--这与马斯克多年来吹嘘的世界级前沿模式几乎不相符。它“只是不是最好的模型。”接受路透社采访的人士表示,解释很简单:Grok不如其竞争对手。
一位不愿透露姓名的五角大楼消息人士表示,这“只是不是最好的型号”,并补充说那里的工作人员往往更喜欢双子座或克劳德。对人工智能模型进行排名的公共排行榜证实了这一观点。
Anthropic、Google和OpenAI占据了领先地位,而Grok在偶尔出现的图像或视频类别之外很少进入前十名。这对马斯克来说很尴尬,对于今年早些时候收购了xAI的SpaceX来说更尴尬。
这家火箭企业的IPO文件显示,该公司已将人工智能(特别是Grok)置于其向投资者推销的核心位置。
SpaceX声称已经确定了“人类历史上最大的可诉总可达市场”:惊人的28美元。5万亿次机会,但遗憾的是,它没有提供实现这一目标的时间表。几乎所有这些估计价值都来自人工智能,特别是企业人工智能,而不是火箭或卫星。
路透社指出,Grok在政府机构的表现也可能暗示它在其他工作场所的表现如何。据报道,作为xAI争取企业客户的一部分,如果银行希望参与SpaceX的IPO,马斯克就会强迫银行购买Grok订阅,但如果他们的钱没有物有所值,这些交易可能会被证明是短期解决方案。
似乎其沉闷的表现还不够尴尬,马斯克最近承认xAI已经使用OpenAI的模型来帮助训练和改进Grok。当公司使用自己的模型时,这个过程被称为蒸馏,是标准的,但当涉及使用竞争对手的系统时,这个过程就更具争议。
Grok甚至无法击败它正在训练的模型。在其面向公众的消费者版本中,Grok故意让人不快。马斯克将聊天机器人称为ChatGPT等工具的偏见较小、审查较少的替代品,但这转化为一款证据标准宽松、对马斯克不健康的痴迷以及长期以来的攻击性、阴谋性和性化输出记录的产品。
即使工作场所的护栏有所不同,这也可能不是企业欢迎的事情。
Grok的辉煌记录包括赞扬阿道夫·希特勒、对大屠杀死亡人数提出质疑、在X上曝光数百万未经同意的性深度造假作品,其中包括儿童作品,以及为种族主义和跨性别恐惧症的维基百科山寨作品和辛辣动漫女友提供动力。
我们不要忘记它自称“机械希特勒”的时候。“如果Grok是一名人类员工,我觉得HR不会花很长时间参与进来。SpaceX似乎理解这个问题。该公司在文件中警告Grok的“辛辣”或“精神错乱”模式存在“更高的风险”,包括声誉损害、监管审查和诉讼。
用企业的话说:这个聊天机器人会让我们被起诉。用企业的话说:这个聊天机器人会让我们被起诉。Grok的名字来自罗伯特·A。海因莱因的《陌生之地的陌生人》,大致意味着对某件事的深刻理解。
这里需要理解的事情并不特别复杂:马斯克花费了数十亿美元建造了一个聊天机器人,它不是很好,不是很受欢迎,而且在某种程度上是证明SpaceX天文估值合理性的关键。祝你好运