AI 见闻

Gemini 3.1 Flash Lite:专为大规模智能而设计

Google DeepMind Blog··约 3 分钟阅读

双子座3。1 Flash-Lite:为大规模智能而构建今天,我们介绍双子座3号。1 Flash-Lite,我们最快和最具成本效益的Gemini 3系列型号。专为大规模开发人员工作负载而构建,3. 1 Flash-Lite凭借其价格和型号级别提供高品质。

从今天开始,3。1 Flash-Lite正在通过Google AI Studio中的Gemini API向开发人员预览,并通过Vertex AI向企业推出。不妥协的成本效益售价仅为0美元。25/1 M输入代币和1美元。

50/1 M输出代币,3. 1 Flash-Lite提供增强的性能,而成本仅为较大型号的一小部分。它的表现优于2。5闪光灯2.根据Artificial Analysis基准测试,首次应答令牌的时间加快了5倍,输出速度提高了45%,同时保持了类似或更好的质量。

高频工作流程需要这种低延迟,使其成为开发人员构建响应式实时体验的理想模型。双子座3。1 Flash Lite优于2。5速度和质量上的闪光。3. 1 Flash Lite在Arena上取得了令人印象深刻的1432分的Elo评分。

ai Leaderboard在推理和多模式理解基准方面优于其他类似级别的模型,包括86个。GPQA Diamond为9%,76。MMMU Pro上的8%-甚至超过了前几代更大的Gemini型号,例如2。

5闪光。为开发人员提供大规模的自适应智能除了原始表现之外,双子座3。

1 Flash-Lite在AI Studio和Vertex AI中标配了思维级别,让开发人员能够控制和灵活地选择模型为任务“思考”多少,这对于管理高频工作负载至关重要。3. 1 Flash-Lite可以处理大规模的任务,如大量翻译和内容审核,其中成本是优先考虑的因素。

它还可以处理需要更深入推理的更复杂的工作负载,例如生成用户界面和仪表板,创建模拟或遵循指令。3. 1 Flash-Lite可立即将数百种不同类别的产品填充到电子商务线框中。3. 1 Flash Lite可以使用实时预报和历史数据实时生成动态天气仪表板。

3. 1 Flash Lite创建了一个SaaS代理,能够为企业执行通用的多步骤任务。3. 1 Flash Lite可以快速分析和排序图像等大量内容。

早期接触AI Studio和Vertex AI的开发人员以及Latitude、Cartwheel和Whering等公司已经在使用3. 1 Flash Lite大规模解决复杂问题。早期测试者强调了3。

1 Flash-Lite的效率和推理能力,可以以更大型模型的精确度处理复杂的输入,并且遵循指示并保持遵守性。我们期待看到您用3构建的内容。1 Flash-Lite和Gemini 3系列的其余型号。

原文出处
Gemini 3.1 Flash-Lite: Built for intelligence at scale

本文为机器翻译辅以 AI 润色,仅供参考。原始事实以原文为准。