Gemini 3.1 Flash-Lite：为大规模智能构建

Google DeepMind Blog·5 个月前·约 3 分钟阅读

双子座3。1 Flash-Lite：为大规模智能而构建今天，我们介绍双子座3号。1 Flash-Lite，我们最快和最具成本效益的Gemini 3系列型号。专为大规模开发人员工作负载而构建，3. 1 Flash-Lite凭借其价格和型号级别提供高品质。

从今天开始，3。1 Flash-Lite正在通过Google AI Studio中的Gemini API向开发人员预览，并通过Vertex AI向企业推出。不妥协的成本效益售价仅为0美元。25/1 M输入代币和1美元。

50/1 M输出代币，3. 1 Flash-Lite提供增强的性能，而成本仅为较大型号的一小部分。它的表现优于2。5闪光灯2.根据Artificial Analysis基准测试，首次应答令牌的时间加快了5倍，输出速度提高了45%，同时保持了类似或更好的质量。

高频工作流程需要这种低延迟，使其成为开发人员构建响应式实时体验的理想模型。双子座3。1 Flash Lite优于2。5速度和质量上的闪光。3. 1 Flash Lite在Arena上取得了令人印象深刻的1432分的Elo评分。

ai Leaderboard在推理和多模式理解基准方面优于其他类似级别的模型，包括86个。GPQA Diamond为9%，76。MMMU Pro上的8%-甚至超过了前几代更大的Gemini型号，例如2。

5闪光。为开发人员提供大规模的自适应智能除了原始表现之外，双子座3。

1 Flash-Lite在AI Studio和Vertex AI中标配了思维级别，让开发人员能够控制和灵活地选择模型为任务“思考”多少，这对于管理高频工作负载至关重要。3. 1 Flash-Lite可以处理大规模的任务，如大量翻译和内容审核，其中成本是优先考虑的因素。

它还可以处理需要更深入推理的更复杂的工作负载，例如生成用户界面和仪表板，创建模拟或遵循指令。3. 1 Flash-Lite可立即将数百种不同类别的产品填充到电子商务线框中。3. 1 Flash Lite可以使用实时预报和历史数据实时生成动态天气仪表板。

3. 1 Flash Lite创建了一个SaaS代理，能够为企业执行通用的多步骤任务。3. 1 Flash Lite可以快速分析和排序图像等大量内容。

早期接触AI Studio和Vertex AI的开发人员以及Latitude、Cartwheel和Whering等公司已经在使用3. 1 Flash Lite大规模解决复杂问题。早期测试者强调了3。

1 Flash-Lite的效率和推理能力，可以以更大型模型的精确度处理复杂的输入，并且遵循指示并保持遵守性。我们期待看到您用3构建的内容。1 Flash-Lite和Gemini 3系列的其余型号。

原文出处

本文为机器翻译辅以 AI 润色，仅供参考。原始事实以原文为准。

相关阅读