AI 见闻
精选· 重要性 5/5

Gemini 3.5 Flash:前沿智能与行动能力结合的新模型系列

Google DeepMind Blog··约 7 分钟阅读
中文导读

Google DeepMind发布Gemini 3.5系列,首款模型3.5 Flash在代理和编码任务上达到前沿性能,速度比同类模型快4倍,并已面向全球用户和开发者开放。

双子座3。5:前沿情报与行动今天,我们介绍双子座3号。5,我们最新的系列模型将前沿智能与行动相结合。这代表着构建更有能力、更智能的代理的重大飞跃。我们将通过发布3来拉开这个系列的序幕。5闪光。

它为代理和编码提供前沿性能,擅长执行复杂的长期任务,提供现实世界的实用性。3. 5 Flash现已面向全球数十亿人开放:

- 通过Google Search中的Gemini应用程序和人工智能模式供每个人使用- 对于我们的代理优先开发平台Google Antigravity和Google AI Studio中的Gemini API中的开发人员- 适用于Gemini Enterprise Age

nt Platform和Gemini Enterprise中的企业。我们也在努力工作3。5亲。它已经在内部使用,我们期待着下个月推出。3. 5 Flash:代理和编码的前沿性能双子座3。5 Flash以您对Flash系列所期望的速度提供与大型旗舰型号相媲美的多个维度智能。

这是我们迄今为止最强大的代理和编码模型,性能优于双子座3。1 Pro具有挑战性的编码和代理基准,例如Terminal-Bench 2。1(76. 2%)、GDP val-AA(1656 Elo)和CP Atlas(83. 6%),并在多模式理解方面处于领先地位(84。

CharXiv Reasoning上的2%)。当查看每秒输出代币时,它比其他前沿模型快4倍。

着陆在人工分析指数的右上象限,3。5 Flash以极快的速度提供前沿智能-证明您不再需要牺牲质量来换取延迟。3. 5 Flash:大规模代理任务速度和性能的这种平衡使得3. 5闪存是处理长期代理任务的理想选择。

过去需要开发人员几天或审计员几周的时间,3. 5 Flash现在可以帮助在一小部分时间内完成,通常成本不到其他前沿型号的一半。它可以快速规划、构建和迭代,以解决现实世界的问题,无论是开发新应用程序、维护代码库还是帮助准备财务文档。

当与更新的反重力背带搭配时,3. 5 Flash成为部署协作子代理的强大引擎,以大规模解决最苛刻的用例的问题。在监督下,它可以可靠地执行多步骤工作流程和编码任务,同时保持前沿性能。由反重力驱动,3。

5 Flash执行多步骤工作流程,根据动态标准自动重命名和分类非结构化资产。利用反重力,3。5 Flash使用两个代理合成AlphaZero纸,并在六小时内编写一款完全可玩的游戏。3. 5 Flash使用反重力背带将混乱的遗留代码库转换为Next。

js. 3. 5 Flash使用子代理在反重力中创建新的城市景观。3.

5 Flash使用两个代理人:一个构建者和一个玩家,在快速自我完善循环中开发反重力游戏。建立在双子座3、3强大的多模式基础上。5 Flash生成更丰富、更具交互性的Web UI和图形。3. 5 Flash为AI Studio上的研究论文创建交互式动画。

3. 5 Flash将纯文本描述转化为AI Studio上的交互式硬件。3. 5 Flash并行执行多个概念,为AI Studio上的学校筹款活动构建完整的品牌概念。3. 5 Flash在AI Studio上只需60秒即可生成不同的结账流程的用户体验方法。

3. 5 Flash:现实世界的影响3. 5 Flash的现实世界代理功能已经为我们的开发人员和企业推动了有意义的进步。在开发3. 5模型系列中,我们与行业合作伙伴密切合作,了解他们的工作流程中出现的辛劳和复杂性。

合作伙伴正在看到有意义的影响--从自动化多周工作流程的银行和金融科技公司到在复杂数据环境中挖掘见解的数据科学团队。Shopify正在并行运行子代理,以长期分析复杂数据,以在全球范围内进行更准确的商户增长预测。

麦格理银行正在试点如何3. 5 Flash可以通过推理复杂的100多页文档、检索相关信息并以低延迟提出可靠的建议来加速客户入职。Salesforce正在整合3.

5闪存到Agentforce,通过部署多个保留上下文并执行复杂、多回合工具调用的子代理,可靠地自动化复杂的企业任务。3. 5 Flash通过对复杂发票的多模式理解结合对历史模式的推理,帮助Ramp实现更智能、更可靠的OCR。

Xero正在部署代理来自主管理复杂的、多周的工作流程,例如识别供应商和收集1099税务表格的信息,使小型企业能够自动执行繁琐的管理任务。Databricks正在使用代理工作流来监控和检索实时信息,在大量数据集上进行推理,以诊断问题,确定修复方案并为数据科学家提出解决方案。

个人人工智能代理:用3. 5闪光3. 5 Flash现在是全球搜索中Gemini应用程序和AI模式的默认型号。在今天的I/O上,我们展示了其代理功能如何为新功能提供动力,将前沿级智能带入您的日常生活。

新的Gemini Spark是您的个人人工智能代理,使用3. 5闪光。它24/7运行,帮助您驾驭数字生活,在您的指导下代表您采取行动。我们今天开始向值得信赖的测试人员推出Gemini Spark,并计划下周将Beta版推出给美国的Google AI Ultra订阅者。

双子座火花使用3. 5 Flash帮助完成这些任务双子座火花使用3. 5 Flash帮助完成这些任务双子座火花使用3.

5 Flash帮助完成这些任务双子座火花使用3. 5 Flash帮助完成这些任务双子座火花使用3. 5 Flash帮助完成这些任务3.增强的代理编码能力。5 Flash还在整个搜索中提供更智能的体验,从引入24/7为您服务的新信息代理到解锁更动态的生成性UI体验。

在我们的博客文章中了解更多信息。搜索利用3。5 Flash构建交互式视觉,解释陀螺仪模式。双子座3。5:建立边境保障措施双子座3。5是根据我们的边境安全框架开发的。我们加强了网络和CBRN保护措施,这意味着它不太可能生成有害内容以及错误地拒绝回答安全询问。

我们通过新的、更先进的安全培训和缓解措施来实现这一目标,包括可解释性工具,这些工具可以帮助在人工智能提供响应之前检查和理解其内部推理。3. 5 Flash今天可用双子座3。

5 Flash通常可通过Google Antigravity、Google AI Studio和Android Studio中的Gemini API、Gemini Enterprise Agent Platform和Gemini Enterprise提供。

现在,它也适用于Gemini应用程序和搜索中的人工智能模式中的每个人。我们代表整个双子座团队迫不及待地想看看你们建造了什么。

原文出处
Gemini 3.5: frontier intelligence with action

本文为机器翻译辅以 AI 润色,仅供参考。原始事实以原文为准。

相关阅读