Gemini 3 Deep Think 更新：推动科学、研究与工程进步

Google DeepMind Blog·5 个月前·约 4 分钟阅读

Gemini 3 Deep Think：推进科学，研究和工程今天，我们发布了Gemini 3 Deep Think的重大升级，这是我们的专业推理模式，旨在推动智能前沿并解决科学、研究和工程领域的现代挑战。

我们与科学家和研究人员密切合作，更新了Gemini 3 Deep Think，以应对严峻的研究挑战--其中问题往往缺乏明确的护栏或单一的正确解决方案，而且数据往往混乱或不完整。通过将深厚的科学知识与日常工程实用性相结合，Deep Think超越抽象理论，推动实际应用。

新的Deep Think现已在Gemini应用程序中向Google AI Ultra订阅者提供，并且我们还首次通过Gemini API向精选研究人员、工程师和企业提供Deep Think。表示有兴趣抢先体验这里。

以下是我们的早期测试人员如何使用最新的Deep Think：罗格斯大学数学家丽莎·卡伯恩致力于高能物理学界所需的数学结构，以弥合爱因斯坦引力理论和量子力学之间的差距。在一个现有训练数据很少的领域，她使用Deep Think来审查一篇技术性很强的数学论文。

Deep Think成功地发现了一个微妙的逻辑缺陷，这个缺陷以前在人类同行评审中没有被注意到。

在杜克大学，Wang实验室利用Deep Think优化复杂晶体生长的制造方法，以发现半导体材料的潜在潜力。Deep Think成功设计了一种生长大于100 μm的薄膜的配方，实现了之前方法难以实现的精确目标。

谷歌平台和设备部门的研发主管、Liftware前首席执行官Anupam Pathak测试了新的Deep Think，以加速物理组件的设计。

通过数学和算法的严谨性提升推理去年，我们证明了Deep Think的专业版本可以成功应对推理方面的一些最艰难的挑战，在数学和编程世界锦标赛上达到金牌标准。最近，Deep Think使专业代理能够进行研究级数学探索。

更新后的深度思考模式继续推动智能前沿，在最严格的学术基准上达到新的高度，包括：- 制定新标准（48. 4%，没有工具）参加人类最后一次考试，这是一个旨在测试现代前沿模型极限的基准- 达到前所未有的84.

ARC-AGI-2上的6%，经ARC奖基金会验证- 在CodeForces上达到惊人的3455 Elo，这是由竞争性编程挑战组成的基准- 在2025年国际数学奥林匹克竞赛中达到金牌水平驾驭复杂的科学领域除了数学和竞争性编码之外，

Gemini 3 Deep Think现在还在化学和物理等广泛的科学领域表现出色。我们更新的深度思考模式在2025年国际物理奥林匹克竞赛和化学奥林匹克竞赛的书面部分展示了金牌级别的成绩。它还表现出对高级理论物理的熟练程度，得分为50分。

CMT-Benchmark为5%。加速现实世界工程除了其最先进的性能外，Deep Think还旨在推动实际应用，使研究人员能够解释复杂的数据，使工程师能够通过代码对物理系统建模。

最重要的是，我们正在努力将深度思考带给研究人员和从业者最需要的地方--从Gemini API等表面开始。通过更新的Deep Think，您可以将草图变成3D打印现实。Deep Think分析绘图、建模复杂形状并生成一个文件以通过3D打印创建物理对象。

通过我们的抢先体验计划向Google AI Ultra订阅者和Gemini API提供从今天开始，Google AI Ultra订阅者将能够在Gemini应用程序中访问更新的Deep Think模式。

科学家、工程师和企业现在还可以表达对我们通过Gemini API测试Deep Think的抢先体验计划的兴趣。我们迫不及待地想看看你的发现。

原文出处

本文为机器翻译辅以 AI 润色，仅供参考。原始事实以原文为准。

相关阅读