AINews：一切皆是指挥家

Latent Space (Swyx)·2 个月前·约 8 分钟阅读

[AINews]一切都是导体超安静的一天让我们强调一个较小的趋势。如果您对人工智能如何改善医疗保健感兴趣，请收听我们今天推出的第一个播客，如果您想认识该领域的其他顶级工程师，请申请发言！

进化生物学中有一个笑话：“一切都是螃蟹”：螃蟹形状因子在地球上独立进化了至少7次：今天专栏文章的直接原因是GitHub宣布推出新的GitHub应用程序-正如Oren Melamed所说，“如果你首先是代码，你可能想继续使用VS Code，但如果你首先是代理人，

GitHub第一，你将享受一次享受！

”嗯.看起来很眼熟.这对于Conductor来说当然是非常好的，它是这种外形的先驱，现在Y Combinator的人工智能首席执行官Garry Tan是一个响亮的粉丝：现在来回答价值20亿美元的问题：如果您开创了一种外形因素，那么当其他人复制它时，您如何将其货币化？

接下来是什么？对于那些对替代历史感兴趣的人来说，以下是去年短暂流行的看板外形因素发生的情况：玛吉·阿普尔顿（Maggie Appleton）详细介绍了GitHub Ace背后的设计思维：人工智能新闻2026年5月13日至2026年5月14日。

我们检查了12个subreddits、544个Twitter用户，没有进一步的Discords。AINews的网站允许您搜索所有过去的问题。提醒您的是，AINews现在是潜伏空间的一部分。您可以选择加入/退出电子邮件频率！

人工智能Twitter回顾编码代理工具：Codex Mobile、GitHub的新应用程序、VS Code多代理UX和Hermes/Codex InteropOpenAI将Codex进一步推入日常工作流程：

这一系列中最大的产品发布是ChatGPT移动应用程序中的Codex，它允许用户启动任务、审查输出、批准命令并远程引导执行，同时Codex继续在笔记本电脑、Mac mini或Devbox上运行。

OpenAI还指出，远程SSH现在通常可用于托管远程环境，后来在Codex循环周围添加了用于业务/企业自动化的挂钩和编程访问令牌（OpenAI、OpenAI后续、移动工作流程上的@ OpenAIDevs、远程SSH上的@OpenAIDevs、

挂钩/令牌上的@OpenAIDevs）。另外，OpenAI在Codex的Wii沙箱上发布了一篇技术文章，重点关注编码代理的实用性和受限制的机器访问之间的权衡（OpenAI Devs，@gDB）。

更广泛的IDE/应用生态系统正在向“代理优先”的用户体验融合：GitHub宣布了GitHub Copilot应用程序的技术预览版，该应用程序被描述为用于并行工作流、repo/PR生命周期管理和模型灵活性的桌面环境（GitHub，@adrianMG，@OrenMe）。

VS Code通过vscode提供了一个新的Agents窗口，用于多代理、多项目工作流程、浏览器/移动支持。开发/代理、BYOK改进和代币效率功能，例如压缩的终端输出（VS Code、远程/浏览器支持、BYOK更新、终端压缩）。

在开放方面，Nous/Hermes Agent添加了Codex运行时集成，通过Codex CLI/应用程序服务器有效地路由OpenAI支持的转弯，并在Hermes会话中重复使用ChatGPT订阅支持的执行（Nous Research、@Teknium、

@HermesAgentTips）。Kimi还推出了Kimi Web Bridge，这是一个浏览器扩展，将类人的网络交互暴露给Kimi Code CLI、Claude Code、Cursor、Codex、Hermes等（Moonshot AI）。

代理基础设施和自我改进循环：LangSmith Engine、SmithDB、沙箱和持续学习LangChain的启动栈是最实质性的代理基础设施发布集群：SmithDB是专门为代理跟踪数据构建的数据库，而LangSmith Engine则使用跟踪、集群故障、

识别可能的代码问题并提出修复/评估-将可观察性转变为改进循环，而不是被动检查（@hwchase17，@caspar_br on Engine，@ guardannyhill）。

社区评论强调了SmithDB的体系结构转向对象存储和此工作负载形状的自定义存储/查询路径（SmithDB上的@caspar_br，@ngates_，中文摘要）。

LangChain还宣布推出LangChain Labs，这是一项围绕代理人持续学习的应用研究项目，其论文是生产痕迹应该成为长期训练信号、评估和有针对性的能力改进（LangChain、@jakebroekhuizen、@willccbb、

Prime Intelligence合作伙伴关系）。

代理的执行隔离不断成熟：W & B/CoreWeave推出CoreWeave Sandbox，用于RL中的隔离执行、工具使用和评估工作负载，显式测试破坏性命令，例如rm -ref/按比例（重量和偏差）。

本着类似的精神，围绕代理调试的开源/本地开发工具浮出水面：@benhylak强调了一个免费的本地代理调试堆栈，其中的跟踪暴露于Codex/Claude Code以进行自动评估创作。

人性化克劳德代码限制和开发者反弹生态系统最强烈的反应是对Anthropic限制/重塑Claude Code的使用，特别是对于第三方包装器和大容量编程工作流程。

Theo的帖子成为焦点：他认为，尽管通过官方支持的路径进行集成，T3 Code的用户实际上还是受到了急剧的费率限制降低的打击，他随后取消了订阅，同时鼓励其他人发布开源捐款的取消截图（@theo初始线程、订阅取消、捐赠线程、T3 Code澄清）。

其他著名的构建者也抱怨Anthropic实际上切断了开源开发/应用程序并破坏了围绕其构建的安全带的稳定性克劳德-p（@theo，@andersonbcdefg）。

还有一个更具战略性的反驳：一些用户认为，Anthropic不欠开发者为第三方应用程序提供大量补贴的固定费用代币，并且生态系统可能会转向更明确的API经济学以及更智能的昂贵和廉价模型之间的路由（Sentdex，@tadasayy）。

尽管如此，可见的流失信号并不平凡，包括用户仅因回复线程取消而估计有意义的ARR损失（@thegenioo、Bob Martin叔叔、Theo后来）。对于代理工程师来说，实际的要点很简单：订阅支持的网络不是稳定的平台基元;

提供商/模型抽象和BYOK路径看起来越来越强制。机器人技术和排队人工智能：Figure的24/7分拣流和更广泛的自动化信号Figure的直播主导了机器人讨论。

该公司首先展示了8小时的完全自主、无人监督的工作，然后扩展到24/7直播，最终报告了24小时以上的连续自主操作，没有出现故障，围绕小包裹分拣的人类对等吞吐量，以及由HSYS-02完全在机上运行的操作，

OOD案件自动重置-明确声称没有远程操作（图首席执行官Brett Adcock，24小时更新，详细技术澄清，第2天直播）。重复的“鲍勃、弗兰克和加里”更新更加模糊，但核心信号是在类似生产的状态下持续自主操作。

解释分为对Figure的怀疑和对机器人加速的更广泛信念。一些评论者认为，批评者低估了这些示威对短期劳动力替代的影响，而其他人则指出，怀疑更多地是针对Figure，而不是针对机器人这个类别（@cloneofsimo、@iScienceLuvr、@kimmonismus）。

无论哪种方式，这都是该批次中最清晰的“连续收件箱”演示之一。研究、基准和开放模型：扩散LM、时间序列FM、机制解释性和RL/搜索一些具有技术意义的模型/研究版本脱颖而出：Zyphra的ZAYA 1 - 8B-Distribution-Preview获得4分。

6-7.与自回归生成相比，解码加速7倍，质量损失有限，这使得扩散LM能够实现更便宜的部署和更丰富的生成模式（Zyphra）的常见情况。Datadog的Toto 2。0发布了从4 M到2的5个开权时间序列预测模型。

Apache 2下的5 B参数。0，声称#1 o

原文出处

[AINews] Everything is Conductor

本文为机器翻译辅以 AI 润色，仅供参考。原始事实以原文为准。

AINews：一切皆是指挥家

相关阅读

Bluesky AI助手Attie扩展为开放社交研究工具

Midjourney 收购占星社交应用 Co-Star，拓展产品线

硅谷在中国AI开放权重模型问题上严重分裂