AI 见闻
精选· 重要性 4/5

AI代币账单到期:行业竞相应对失控成本

TechCrunch — AI··Rebecca Bellan·约 7 分钟阅读
中文导读

随着AI采用激增和智能体普及,企业代币消耗远超预算,引发成本危机。Linux基金会成立Tokenomics基金会制定标准,市场涌现追踪工具,但ROI衡量仍是难题。

整个行业开始对AI的价格望而却步。截至4月,Uber已耗尽2026年全年的AI编码预算。微软在启用开发者Claude Code许可证几个月后便将其吊销。Priceline一位员工告诉TechCrunch,Cursor的常规合同续签价格涨了4到5倍。

尽管每代币价格下降,但AI采用率的提升和日益自主的智能体推动代币消耗量持续攀升。那些在2025年初尽情享用无限订阅的公司,如今正急于弄清资金去向、削减支出,并试图从预算残局中挽回一些投资回报率。

与此同时,一个市场正在形成以满足这些需求。初创公司、老牌供应商和一个新的标准机构都在竞相为企业提供追踪支出的工具和语言。“六个月前,我与客户交谈时,话题全是‘它能做什么?够好吗?

’”OpenAI企业主管Alexander Embiricos本周在纽约市的一场活动中告诉TechCrunch。“现在我们的谈话从不涉及这些。现在的对话是:‘嘿,我们花了这么多钱。你们有什么可见性?

有什么可审计性?有什么代币控制?你们的模型效率如何?’

正是在此背景下,Linux基金会本周公布了Tokenomics基金会的计划。这个新的标准机构旨在为AI代币注入类似FinOps对云支出那样的成本纪律。

“4月和5月,我开始听到公司说:‘天哪,我们整个2026年的代币预算已经超了3倍,而现在才4月,’”Linux基金会旗下项目FinOps基金会的执行董事J. R. Storment告诉TechCrunch。

“我们开始听到生存危机,整个对话从‘代币最大化’和‘快速推进’转向了‘我们需要护栏,如何控制?’”科技界的呼声源于CEO们强烈要求团队使用最佳模型、快速行动,不惜成本。

11月发布的新模型,如Anthropic的Claude Opus 4.5、OpenAI的GPT-5.1和Google的Gemini 3 Pro,显著改进了智能体工具,从而成倍增加了消耗。据报道,一家公司因忘记为员工设置使用限制,最终收到了5亿美元的Claude账单。

“这就像快克可卡因的流行病,”Priceline IT财务高级总监Chris Reed说,他指出公司已开始对某些群体设置代币限制。“他们让你尝试,让你上瘾,然后你就受制于它了。”

工程运营平台Faros AI首席执行官Vitaly Gordon表示,他最近与一位CTO交谈,对方告诉他:“我的一名工程师上个月在代币上花了4万美元,我真的不知道是该阻止他,还是该告诉其他人都像他一样。

”Faros 3月的一项调查发现,在2万名开发者中,产出在上升,但错误和重写也在增加。工程管理平台Jellyfish同样发现,使用代币最多的工程师效率大约是较少使用AI者的两倍,但他们消耗的代币数量是后者的10倍。

Jellyfish研究主管Nicholas Arcolano通过电子邮件告诉TechCrunch,AI支出激增很大程度上归因于智能体功能,每位开发者的消耗量在九个月内增长了约18.6倍。总体而言,这些统计数据使生产力情况比支出所显示的更为模糊。

“极端支出是否值得,取决于交付代码的最终商业价值(例如收入),而大多数公司仍无法衡量这一点,”Arcolano说。测量问题至少部分源于当前AI使用的庞大规模。“跟踪云成本是一个每月数亿行数据的问题,”Storment说。

“跟踪代币成本是一个每月数万亿行数据的问题。你不能把它塞进任何电子表格甚至基本工具里。你必须从根本上重新思考你的工具、规格和会计系统。”

在Priceline,Reed已经看到了差异。他指出供应商报告的使用情况与Priceline内部数据之间存在问题。“我的职业生涯始于电信费用管理,我看到了从电信到云再到AI的所有相似之处,”他说。

“每当你引入新事物,计费错误以及审计和优化机会就会随之而来。”围绕这个问题,一个市场正在形成。有纯玩家公司,如Pay-i,它跟踪、衡量和优化GenAI投资的成本和性能。而Paid则让开发者跟踪成本、衡量使用情况,并根据实际价值而非订阅费向用户收费。

还有Jellyfish、Waydev和Faros AI等公司,它们都提供AI智能体监控以证明开发者工具的ROI。Storment表示,FinOps基金会内的180家供应商中,大多数都倾向于这一领域。

拥有现有分销渠道的公司也在增加新功能以利用这个新市场。Ramp最近进入了AI支出管理领域;Datadog和New Relic增加了云成本管理、代币级可观测性和GPU监控等服务。在下周的FinOps X大会上,AWS预计将推出针对企业AI支出的新财务管理功能。

NEA合伙人Tiffany Luck认为,代币效率和可观测性可能会被添加到“工具或应用层”。

她提到了Factory,一家为企业制造AI智能体的初创公司,本周推出了一款模型路由器,可自动为每项任务选择正确的模型。Gordon预计前沿实验室和其他模型提供商将采用OpenRouter风格的优化,将查询导向最便宜的模型——这一趋势已在企业Claude账单上显现。

“关于你在Anthropic上花了多少钱的财务报告,即使你调用Opus模型,部分支出也会落在Sonnet或Haiku上,因为它们足够智能,”Gordon说。“我认为这将成为越来越普遍的现象。

”但所有这些工具的构建都缺乏关于代币成本、产出以及如何比较不同供应商支出的通用语言或共享定义。这正是Tokenomics基金会希望发挥作用的地方。该基金会正在为“代币经济学”构建规范定义和框架;

为AI代币使用和计费制定开放标准、规范和指标;以及为AI经济学制定新指标,如每智能成本或每瓦代币。它还计划定义代币工厂效率和消耗效率的指标。该组织计划于7月正式启动,并将在下周的FinOps X大会上宣布更多成员。

“代币经济学从根本上比我们以前以这种规模管理的任何东西都更抽象和不透明,”Salesforce首席可用性官Nishant Gupta在一份声明中表示。

“它需要一种不同于行业为云构建的运营能力。”尽管如此,高盛预计到2030年全球代币使用量将增长24倍。已经超预算的公司现在就需要解决方案,而基金会的首个交付成果仍需数月时间。“也许我们创造了蒸汽机,但还没有弄清楚装配线,”Gordon说。

根据Arcolano的说法,明智之举是广泛而适度地采用。“最佳ROI来自将广泛的中间用户从低使用率提升到中等使用率,而不是将重度用户推得更高,”他说。Russell Brandom和Tim Fernholz对本文有贡献。

原文出处
The token bill comes due: Inside the industry scramble to manage AI’s runaway costs

本文为机器翻译辅以 AI 润色,仅供参考。原始事实以原文为准。

相关阅读