AI 见闻

[AINews] Cognition在26亿美元D轮融资中筹集了10亿美元

Latent Space (Swyx)··约 8 分钟阅读

[AINews] Cognition在26亿美元D轮融资中筹集了10亿美元编码是一个不受限制的MEK市场我们最后一次在9月份的10亿美元C系列中撰写了有关认知的文章,当时Sol。ai还加入了Cognition,AINews最终被搬到了潜伏空间。

8个月后,价值2. 5倍以上,正式成为人工智能领域仅存的最大独立代理实验室,这是我们去年制定的论文。

通过官方ARR披露(目前预计EOY的ARR超过10亿美元),您可以绘制出增长情况,这看起来与2025年WTF图表中发生的情况奇怪地相似(这不是巧合):在企业SaaS业务中,ARR是利用率的跟踪指标,

企业和初创企业生态系统中一些最强硬/最挑剔的客户的徽标也是如此(包括上周推出的Exa和Modal)我们将于明天在认知播客上发布更多内容。人工智能新闻2026年5月26日至2026年5月27日。

我们检查了12个subreddits、544个Twitter用户,没有进一步的Discords。AINews的网站允许您搜索所有过去的问题。提醒您的是,AINews现在是潜伏空间的一部分。您可以选择加入/退出电子邮件频率!

人工智能Twitter回顾推理效率、服务架构和成本曲线推理优化日益具有架构性,而不仅仅是核心级:EAGLE 3。

1通过稳定隐藏状态反馈和减少更深解码步骤中的注意力漂移来提高推测解码的鲁棒性,明确强调长上下文接受长度和现实世界的服务可靠性;该团队还强调了与vLLM和TorchSPP的合作。

在内核/系统层,Perplexity开源了重建的Unigram令牌化器,该器将中央处理器利用率降低5-6倍,并在514个令牌时达到63 µs,堆分配为零,而Qwen 3.据报道,通过Alibaba、LightSeek、NVIDIA、

Mooncake和Flash Attention-4贡献者的联合优化,TokenSpeed上的5上的代理工作负载达到了580个代币/秒。支持库也得到了改进:MaxSim v2添加了backprop并报告了10。

H200和11上的速度提高了33倍。A100与天真的PyTorch的94倍。结构性KN缓存和注意力变化是降价的合理性:几篇帖子集中在同一个主题上:中国实验室最近的API降价看起来是可持续的,因为它们反映了较低的单位服务成本,而不是临时补贴。

@kimmonismus总结了DeepSeek V4-Pro如何使用混合注意力与压缩稀疏注意力和严重压缩注意力,将1 M令牌KN缓存提升到V3的~10%。2,单令牌推理FLOP达到27%,同时仍路由49 B活动参数(满分1)。

总共6 T。小米的MiMo同样使用SWA和分层缓存管理来减少缓存流量。

@_LuoFuli直接证实了这一点,他说MiMo最大的输入缓存价格削减来自5倍的缓存令牌容量,大约80%的缓存成本降低,以及1:7的架构Full:SWA稀疏率。更广泛的外卖:长上下文推理经济学现在正受到注意力设计+缓存层次结构+路由的推动,而不仅仅是更便宜的硬件。

智能体、安全带、记忆和持续学习该堆栈正在从“模型质量”转向“模型-利用-记忆匹配”:大量推文专注于实际的代理工程。LangChain发布了Deep Agents v0。使用Delta Channels 6,将200圈编码会话的检查点存储从5。

3 GB至129 MB,还在Fleet中推出了计算机使用,以及用于版本化代理上下文/技能的上下文中心。LangSmith Engine的框架是自动化评估、诊断、修复循环,多位从业者强调了其将跟踪反馈转化为可重复使用的在线/离线评估器的价值。

与此同时,@Vtrivedy10提出了当今最清晰的表述:任务匹配度与模型质量一样重要,定制垂直系统通过缩小工具、提示和任务的上下文范围来优于通用工具。

持续学习正在重新成为一个产品类别,而不仅仅是一个研究主题:这里最大的公告是Trajectory的推出:一个使用产品使用信号和代理跟踪来持续对大型代理模型进行后训练的平台,获得了1500万美元的资金和设计合作伙伴,包括Clay、Harvey、Decagon、

Mercor和Rogo。Baseten表示,它通过FP 8/NVFP 4量化和自动缩放H100基础设施支持这些部署,包括所提到的397 B参数模型的隔夜部署。

开放工具中也出现了同样的趋势:在LangChain/LangShape上构建的开源以内存为中心的代理因显式检索/存储/推理/学习分离而受到多个构建者的称赞,RLM的最低限度训练装备表明,小团队现在可以在8 x A100上一天内对长上下文代理进行RL调整。

主线是“部署后学习”正在从愿望转向底层。基准、缩放定律和培训方法新的基准越来越多地关注长期、混乱、现实世界的工作流程:DeepSWE被强调为SWE/Agent基准,包含5种语言的91个repo中的113项任务,使用极简主义的仅限工作空间工具和较短的提示,但需要5个。

平均代码和触摸7个文件比SWE-Bench Pro多5倍。在企业运营方面,Armed Analyses和IBM推出了ITBench-AA,这是Kubernetes事件响应的SRE基准,所有前沿模型的得分低于50%;

Claude Opus 4。7领先,47%,GPT-5。

紧随其后的是5,为46%,GLM-5。1推理导致开放重量为40%。另一个有用的可靠性角度来自AgingBench,它将部署的代理降级定义为由压缩、干扰和内存更新引起的寿命问题。

训练效率研究在理论和系统中仍然活跃:Sakana AI的扩散块是技术上最有趣的版本之一:它将正向传递重新解释为类似扩散的去噪步骤,以便深度网络可以一次一个块地训练,大大减少内存,同时匹配跨ViT、DiT、掩蔽扩散、自回归转换器和回归深度转换器的端到端性能。

RL系统方面,Snowflake推出了ZoRR,声称最高可达3. 5倍更快的长上下文RL和3倍。通过消除冗余的卷展计算,以及专门的Arctic-Text 2SQL-R2企业SQL模型,延长了2倍的上下文窗口。

在理论方面,Tiberiu Musat的预印本认为,最小神经权重规范与固定精度网络的最小程序长度匹配,最高可达log因子,而统一神经缩放定律提出了一种多元函数形式,旨在比之前的曲线更准确地外推神经缩放行为。

模型和形态发布:生物学、视觉、OCR和嵌入式人工智能蛋白质建模度过了非凡的一天:ESMold 2被宣布为蛋白质结构预测和设计的开放科学引擎,报告了有关蛋白质相互作用和抗体的强有力结果,以及附带的6个地图集。

8B蛋白质和1. 1B预测结构。该版本强调了实际设计成果(跨五种治疗靶点的迷你蛋白结合物和链抗体)以及有关紧急蛋白质表示的机制解释性发现。

该版本得到了@ Protein rosh的响应,并得到了@cgeorgiaw的背景分析,他指出该地图集的规模超过了AlphaFold DB。

一波规模较小但实用的多模式/开放版本登陆:Google DeepMind分享了Gemini Embedding 2的白皮书,该白皮书被描述为一个支持文本、图像、音频和视频统一表示的原生多模式嵌入模型。

英伟达的LocateAnything结合了Qwen 2。5-3B + Moon-ViT,用于高速接地,声称可提高10倍的加速,用于密集物体检测。Hugging Face集成了Roboflow的RF-DETR,将其定位为实时检测/分割,其性能优于YOLO风格的系统。

对于文档管道,Surya OCR 2作为650 M型号发货,带有83个。3% OLMOCR工作台,87%基于内部91语言基准测试,RTX 5090上5页/秒;LiteParse v2重写Rust中的解析,实现高达100倍的加速和边缘/浏览器部署

原文出处
[AINews] Cognition raises $1B in $26B Series D

本文为机器翻译辅以 AI 润色,仅供参考。原始事实以原文为准。