[AINews] Google I/O 2026:Gemini 3.5 Flash、Omni(用于视频的NanoBanana)、Spark(后台代理)和Antigravity 2.0
[AINews] Google I/O 2026:Gemini 3。5 Flash、Omni(用于视频的NanoBanana)、Spark(后台代理)和Antigravity 2。0谷歌一直很忙!
完整的主题直播时长2小时,但像往常一样,The Verge的超级剪辑时长为30分钟,非常值得获得叙事感:主线双子座3。5 Flash今天已上市(与一些分阶段推出相比非常好),即使与3相比,它也是一个不错的进步。
1亲,3。5 Pro将于下个月推出。也许更令人印象深刻的是Gemini Live(语音)和Omni(视频)以及Google Pics/Flow(图像/VFX/音乐)模式,其中Google展示了行业领先的能力和延迟,所有这些都可能是由行业领先的硬件和模型实现的。
根据如今每一个大型科技主题演讲的长期传统,谷歌还展示了一些智能眼镜技术,这些技术似乎比谷歌及其同行之前的许多迭代更有可能在街上看到。人工智能新闻2026年5月18日至2026年5月19日。
我们检查了12个subreddits、544个Twitter用户,没有进一步的Discords。AINews的网站允许您搜索所有过去的问题。提醒您的是,AINews现在是潜伏空间的一部分。您可以选择加入/退出电子邮件频率!
人工智能Twitter回顾谷歌利用I/O将Gemini重新定位为消费者人工智能表面和开发者/代理平台,并发布了三项核心技术公告:Gemini 3。
5个Flash用于快速代理/编码工作负载,Gemini Omni用于从视频开始的多模式生成/编辑,以及跨越桌面/CLI/SDK/API的更广泛的反重力代理堆栈。官方帖子强调规模-谷歌表示现在处理超过3个。
每月2万亿代币,同比增长7倍,较每月480 T增长7倍,而Gemini应用程序每月拥有9亿多用户,可在230多个国家和70多种语言(Google、Google、GeminiApp)使用。技术上最具实质性的版本是双子座3。
5 Flash,被Google定义为迄今为止最强的代理/编码模型,立即获得GA,具有1 M令牌上下文、65 k最大输出、4个思维水平(“最小/低/中/高”)和跨轮“思想保存”(GoogleDeepMind、Google、_philschmid)。
谷歌将其与Gemini Omni配对,Gemini Omni是一个将Gemini推理与生成媒体相结合的新家族,最初通过Omni Flash,能够在Gemini、Flow、
Shorts和后来的API中进行文本/图像/视频/音频输入并生成视频编辑/生成(GoogleDeepMind、Google、GeminiApp)。围绕这些模型,谷歌推出或扩展了《反重力2》。
0个桌面、CLI、SDK、Gemini API中的托管代理、搜索原生生成UI/编码、云虚拟机上的Gemini Spark后台代理,以及一长串Gemini应用程序/工作空间/商务/媒体集成(Google、Google、Google)。
事实与观点事实/官方或第三方基准来源直接声称谷歌表示现在处理3.
每月2万亿代币,高于一年前的480万亿代币(Google)。谷歌表示双子座每月拥有超过9亿用户(谷歌)。谷歌称双子座3。
5 Flash现已广泛应用于Gemini应用程序、Search AI Mode、Gemini API、AI Studio、Antigravity、Android Studio和企业界面(Google、GeminiApp)。
谷歌称双子座3。5 Flash具有1 M上下文、65 k最大输出、4个思维水平以及跨回合的“思想保存”(_philschmid)。谷歌说3。5 Flash击败Gemini 3。1 Pro on Terminal-Bench 2。
1、GDPval-AA和HCP Atlas(GoogleDeepMind、Google)。谷歌说3。5 Flash的运行速度是同类前沿型号的4倍,在反重力(Google、JeffDean)中运行速度最高可达12倍。
独立基准人工分析报告双子座3。5 Flash的情报指数得分为55,与Gemini 3 Flash相比+9,输出tok/s>280,MMMU-Pro 84%,GDPval-AA Elo 1656,定价1美元。
50 /9美元。每1 M个输入/输出令牌00;它还报告模型为5。其套件上的运行成本比Gemini 3 Flash高5倍,比Gemini 3高75%。1 Pro(StudicialAnlys)。
竞技场报道双子座3。5 Flash在文本竞技场(text Arena:Frontend)中的总体排名第9,在代码竞技场(Code Arena:Frontend)中的总体排名第9,得分为1507,比Gemini 3 Flash跃升+70,成为其价格级别(竞技场)中的最高分。
谷歌表示,Gemini Omni Flash今天已在Gemini/Flow中向付费用户提供,本周开始在Shorts/Create中免费提供,并在未来几周内通过API提供(Google)。
谷歌表示,Spark在专用的Google Cloud虚拟机上运行,允许在用户设备关闭时执行长时间运行的任务(谷歌)。谷歌声称推出反重力+双子座3。5 Flash演示使用93个并行子代理、15 k+模型请求、2个小时内构建了一个正常运行的操作系统。
6 B代币和<1,000美元的API积分(Google)。谷歌表示搜索将使用反重力+ 3。5 Flash实时生成自定义视觉工具/模拟(Google)。
观点/解释/怀疑积极的看法:“谷歌回来了”,“对Flash模型的疯狂评价”,“对AGI的世界模型”,“令人兴奋的”搜索+反重力,等等(kimmonismus,Kseniase_,shassabis)。
中立的警告:一些发帖者明确避免过度炒作,因为他们自己报告了基准测试,并指出了定价/性能问题(scaling 01,simonw)。消极/怀疑需要关注:相对于早期Flash型号的价格上涨(enricarity)。
比较GPT-5。5-媒体可能更智能/更便宜/更快的端到端(scaling 01、scaling 01)。
基准警告,例如较弱的TerminalBench-Hard、平庸的MRCR / ARC-AGI-2,或者在某些方面没有明显击败Kimi/GLM(scaling 01、taxesTex、scaling 01)。
围绕Gemini CLI与Antigravity CLI的产品命名/用户体验混乱以及更广泛的界面设计批评(zactratar、kchonyc、unces taxesTex)。双子座3。5 Flash:主要技术发布官方定位谷歌/DeepMind反复描述双子座3。
5 Flash是该公司迄今为止最强大的代理和编码模型,而不是其绝对的旗舰智能模型。它旨在位于帕累托前沿的高速、高实用性部分,为谷歌产品和开发人员工作负载(GoogleDeepMind、谷歌、SundarPichai)提供支持。
技术详情和指标来自Google和附属帖子:GA现已发布(Google)1 M令牌上下文窗口最大输出令牌65 k思维水平:最低、低、中(新默认)、高多轮对话中的思想保存文本输出输入方式:人工分析的文本、图像、视频、语音(_philschmid,
VirgicialAnlys)定价:1美元。50 /1 M输入,9美元。00 /1 M输出,缓存输入的90%折扣(scaling 01,可选Anlys)官方基准声明:终端-工作台2. 1:76。
2%GDP val-AA:1656 EloMCC阿特拉斯:83。6%谷歌引用的多模式结果:MMMU-Pro 83。一个工程师职位为6%;
人工分析报告84%,这是其设置中记录的最高水平(korayspel、EnterprisicialAnlys)速度声称:谷歌营销主张:比同类前沿型号快4倍(谷歌)谷歌表示,在反重力中速度最高可提高12倍(JeffDean,
scaling 01)观察到的人工分析>280输出tok/s反重力特定优化服务中引用的一些讨论~867 tok/s(scaling 01,scaling 01)第三方评估:人工分析说3。
5 Flash是智能与速度帕累托前沿的领导者,但经济状况明显比之前的Flash差:智力指数55+9战胜双子座3 Flash幻觉率降低至61%,
与全知设置下的Gemini 3 Flash相比下降31分GDPval-AA 1656 Elo5.在其基准套件上运行的成本是Gemini 3 Flash的5倍比双子座3号贵75%。
同一套件上的1个Pro(CLARicialAnlys)竞技场:#9文本竞技场#9代码竞技场:前台1507分,比Gemini-3 Flash +70比双子座3更好。
1 Pro在其前端编码评估中跨类别(竞技场、竞技场)影响值得注意的转变是,谷歌似乎正在为一个模型使用“Flash”标签,在之前的周期中,该模型更像是针对部署进行优化的高端产品模型,而不是简单的廉价轻量级层。
一些海报直接指出了这一点,认为Flash变得越来越昂贵,并且可能会吸收前Pro领域(enricupe,simonw)。斯特龙
本文为机器翻译辅以 AI 润色,仅供参考。原始事实以原文为准。