科技公司能否接受更便宜的人工智能模型?
随着AI模型成本上升,行业开始质疑“越大越好”的假设,转向更小、更便宜的模型可能改变AI经济格局,影响OpenAI和Anthropic等大实验室的IPO前景。
人工智能热潮建立在一个基本假设之上:更大的模型更强大,最强大的模型获胜。现在,该行业即将了解,如果这一假设开始被打破,会发生什么。不断上涨的成本已经迫使用户重新审视更小、更便宜的模型。这种注重成本的模型选择是新现象,目前尚不清楚它将如何影响该行业,但影响可能十分显著。
Coinbase联合创始人布莱恩·阿姆斯特朗(Brian Armstrong)给出的一个预测是,这将导致绝大多数任务转向更便宜的模型。阿姆斯特朗在X上写道:“对智能的需求几乎是无限的,但80%的工作负载将在12-18个月内运行在便宜99%的模型上。
20%的工作负载仍将运行在最新一代模型上,因为智商最大化至关重要。”如果阿姆斯特朗的预测成为现实,这对人工智能行业来说将是一个重大转变,再怎么强调也不为过。在此之前,大多数人工智能公司都在质量上竞争,这意味着默认使用最先进的可用模型。
如果这些工作可以由更便宜的模型来处理而不影响质量,这将意味着人工智能经济学的巨大转变。至关重要的是,大部分节省的资金将来自大型实验室的口袋,在OpenAI和Anthropic准备IPO之际,这对它们造成了财务打击。
这可能是该行业的一场巨大变革,其基础在于一个基本问题:公司准备好转向较小的模型了吗?
初步测试表明,当系统安排正确时,更便宜的模型可以替代,而不会牺牲任何质量。在法律AI工具Harvey最近的一次测试中,该公司能够在不降低质量的情况下将推理成本降低3倍。
该测试是与推理平台Fireworks AI合作进行的,结合了Claude Opus和Fireworks的GLM 5.1,并针对最密集的任务切换到Opus。结果是,就服务器时间和总体成本而言,负载显著降低。
Harvey联合创始人Gabe Pereyra告诉TechCrunch:“质量是第一位的,在法律领域永远是第一位的。”他指的是他的初创公司提供的人工智能法律服务。“然而,质量的定义正在从简单地使用最强大的模型处理一切,演变为使用最有效地获得正确答案的最佳模型。
”这种趋势通常被描述为主要实验室与中国模型或开放权重模型之间的竞争,但这忽略了更重要的一点。真正的分歧不在于专有模型和开放模型之间,而在于大型模型和小型模型之间。
你可以通过从GPT-5.5切换到DeepSeek的V4 Flash来省钱,但切换到GPT-5.4-mini也同样有效。大型实验室的内部推理和独立提供的开放权重模型之间正在进行一场激烈的价格战。
对于小与大这个更大的问题来说,哪种小型模型获胜并不重要。
所有这些看起来都很明显——当然,你不应该使用超出必要的计算资源——但这与迄今为止主导行业的扩展优先方法背道而驰。受到惨痛教训的启发,实验室努力训练尽可能计算密集型的模型,推动人工智能模型的前沿。
由于价格得到投资者的大力补贴,客户除了最先进的选项之外没有理由选择其他。随着代币价格上涨和补贴放缓,用户首次面临成本压力。我们不知道新的成本压力是否真的会推动企业用户转向更小的模型。他们可以通过减少调用次数、使用更少的上下文,或干脆放弃最没有前景的部署来轻松节省开支。
但如果事实证明大多数部署都可以在较小的模型上运行良好,那么这可能会严重抑制日益增长的推理需求,并引发关于如何证明训练前沿模型成本合理性的新问题。