AI 见闻

[AINews]一切都是导体

Latent Space (Swyx)··约 8 分钟阅读

[AINews]一切都是导体超安静的一天让我们强调一个较小的趋势。如果您对人工智能如何改善医疗保健感兴趣,请收听我们今天推出的第一个播客,如果您想认识该领域的其他顶级工程师,请申请发言!

进化生物学中有一个笑话:“一切都是螃蟹”:螃蟹形状因子在地球上独立进化了至少7次:今天专栏文章的直接原因是GitHub宣布推出新的GitHub应用程序-正如Oren Melamed所说,“如果你首先是代码,你可能想继续使用VS Code,但如果你首先是代理人,

GitHub第一,你将享受一次享受!

”嗯.看起来很眼熟.这对于Conductor来说当然是非常好的,它是这种外形的先驱,现在Y Combinator的人工智能首席执行官Garry Tan是一个响亮的粉丝:现在来回答价值20亿美元的问题:如果您开创了一种外形因素,那么当其他人复制它时,您如何将其货币化?

接下来是什么?对于那些对替代历史感兴趣的人来说,以下是去年短暂流行的看板外形因素发生的情况:玛吉·阿普尔顿(Maggie Appleton)详细介绍了GitHub Ace背后的设计思维:人工智能新闻2026年5月13日至2026年5月14日。

我们检查了12个subreddits、544个Twitter用户,没有进一步的Discords。AINews的网站允许您搜索所有过去的问题。提醒您的是,AINews现在是潜伏空间的一部分。您可以选择加入/退出电子邮件频率!

人工智能Twitter回顾编码代理工具:Codex Mobile、GitHub的新应用程序、VS Code多代理UX和Hermes/Codex InteropOpenAI将Codex进一步推入日常工作流程:

这一系列中最大的产品发布是ChatGPT移动应用程序中的Codex,它允许用户启动任务、审查输出、批准命令并远程引导执行,同时Codex继续在笔记本电脑、Mac mini或Devbox上运行。

OpenAI还指出,远程SSH现在通常可用于托管远程环境,后来在Codex循环周围添加了用于业务/企业自动化的挂钩和编程访问令牌(OpenAI、OpenAI后续、移动工作流程上的@ OpenAIDevs、远程SSH上的@OpenAIDevs、

挂钩/令牌上的@OpenAIDevs)。另外,OpenAI在Codex的Wii沙箱上发布了一篇技术文章,重点关注编码代理的实用性和受限制的机器访问之间的权衡(OpenAI Devs,@gDB)。

更广泛的IDE/应用生态系统正在向“代理优先”的用户体验融合:GitHub宣布了GitHub Copilot应用程序的技术预览版,该应用程序被描述为用于并行工作流、repo/PR生命周期管理和模型灵活性的桌面环境(GitHub,@adrianMG,@OrenMe)。

VS Code通过vscode提供了一个新的Agents窗口,用于多代理、多项目工作流程、浏览器/移动支持。开发/代理、BYOK改进和代币效率功能,例如压缩的终端输出(VS Code、远程/浏览器支持、BYOK更新、终端压缩)。

在开放方面,Nous/Hermes Agent添加了Codex运行时集成,通过Codex CLI/应用程序服务器有效地路由OpenAI支持的转弯,并在Hermes会话中重复使用ChatGPT订阅支持的执行(Nous Research、@Teknium、

@HermesAgentTips)。Kimi还推出了Kimi Web Bridge,这是一个浏览器扩展,将类人的网络交互暴露给Kimi Code CLI、Claude Code、Cursor、Codex、Hermes等(Moonshot AI)。

代理基础设施和自我改进循环:LangSmith Engine、SmithDB、沙箱和持续学习LangChain的启动栈是最实质性的代理基础设施发布集群:SmithDB是专门为代理跟踪数据构建的数据库,而LangSmith Engine则使用跟踪、集群故障、

识别可能的代码问题并提出修复/评估-将可观察性转变为改进循环,而不是被动检查(@hwchase17,@caspar_br on Engine,@ guardannyhill)。

社区评论强调了SmithDB的体系结构转向对象存储和此工作负载形状的自定义存储/查询路径(SmithDB上的@caspar_br,@ngates_,中文摘要)。

LangChain还宣布推出LangChain Labs,这是一项围绕代理人持续学习的应用研究项目,其论文是生产痕迹应该成为长期训练信号、评估和有针对性的能力改进(LangChain、@jakebroekhuizen、@willccbb、

Prime Intelligence合作伙伴关系)。

代理的执行隔离不断成熟:W & B/CoreWeave推出CoreWeave Sandbox,用于RL中的隔离执行、工具使用和评估工作负载,显式测试破坏性命令,例如rm -ref/按比例(重量和偏差)。

本着类似的精神,围绕代理调试的开源/本地开发工具浮出水面:@benhylak强调了一个免费的本地代理调试堆栈,其中的跟踪暴露于Codex/Claude Code以进行自动评估创作。

人性化克劳德代码限制和开发者反弹生态系统最强烈的反应是对Anthropic限制/重塑Claude Code的使用,特别是对于第三方包装器和大容量编程工作流程。

Theo的帖子成为焦点:他认为,尽管通过官方支持的路径进行集成,T3 Code的用户实际上还是受到了急剧的费率限制降低的打击,他随后取消了订阅,同时鼓励其他人发布开源捐款的取消截图(@theo初始线程、订阅取消、捐赠线程、T3 Code澄清)。

其他著名的构建者也抱怨Anthropic实际上切断了开源开发/应用程序并破坏了围绕其构建的安全带的稳定性克劳德-p(@theo,@andersonbcdefg)。

还有一个更具战略性的反驳:一些用户认为,Anthropic不欠开发者为第三方应用程序提供大量补贴的固定费用代币,并且生态系统可能会转向更明确的API经济学以及更智能的昂贵和廉价模型之间的路由(Sentdex,@tadasayy)。

尽管如此,可见的流失信号并不平凡,包括用户仅因回复线程取消而估计有意义的ARR损失(@thegenioo、Bob Martin叔叔、Theo后来)。对于代理工程师来说,实际的要点很简单:订阅支持的网络不是稳定的平台基元;

提供商/模型抽象和BYOK路径看起来越来越强制。机器人技术和排队人工智能:Figure的24/7分拣流和更广泛的自动化信号Figure的直播主导了机器人讨论。

该公司首先展示了8小时的完全自主、无人监督的工作,然后扩展到24/7直播,最终报告了24小时以上的连续自主操作,没有出现故障,围绕小包裹分拣的人类对等吞吐量,以及由HSYS-02完全在机上运行的操作,

OOD案件自动重置-明确声称没有远程操作(图首席执行官Brett Adcock,24小时更新,详细技术澄清,第2天直播)。重复的“鲍勃、弗兰克和加里”更新更加模糊,但核心信号是在类似生产的状态下持续自主操作。

解释分为对Figure的怀疑和对机器人加速的更广泛信念。一些评论者认为,批评者低估了这些示威对短期劳动力替代的影响,而其他人则指出,怀疑更多地是针对Figure,而不是针对机器人这个类别(@cloneofsimo、@iScienceLuvr、@kimmonismus)。

无论哪种方式,这都是该批次中最清晰的“连续收件箱”演示之一。研究、基准和开放模型:扩散LM、时间序列FM、机制解释性和RL/搜索一些具有技术意义的模型/研究版本脱颖而出:Zyphra的ZAYA 1 - 8B-Distribution-Preview获得4分。

6-7.与自回归生成相比,解码加速7倍,质量损失有限,这使得扩散LM能够实现更便宜的部署和更丰富的生成模式(Zyphra)的常见情况。Datadog的Toto 2。0发布了从4 M到2的5个开权时间序列预测模型。

Apache 2下的5 B参数。0,声称#1 o

原文出处
[AINews] Everything is Conductor

本文为机器翻译辅以 AI 润色,仅供参考。原始事实以原文为准。