Qwen2.5-Coder：编码更多，学习更多！

Qwen Team Blog·将近 2 年前·约 4 分钟阅读

GABRIB拥抱脸模型镜演示DISCORD介绍四月初，我们推出了CodeQwen 1。5，引起了社区的高度关注。从那时起，我们一直在努力增强编码模型。今天，我们很高兴地宣布发布下一代开源编码模型Qwen 2。

5-Coder，并正式将CodeQwen更名为Qwen-Coder。我们认为“Coder”更人性化、更敏捷，反映了我们未来成为真正编码合作伙伴的愿景。Qwen 2. 5-Coder是Qwen 2的一部分。

5系列，有三种型号尺寸可选：1. 5 B、7 B和32 B版本（即将推出）。此次更新重点关注两项主要改进：扩大代码训练数据和增强编码能力，同时保持数学和一般任务等其他核心领域的强劲性能。收件箱代码更多：Qwen 2。

5-Coder建立在强大的Qwen 2之上。5并继续训练更大规模的代码数据，包括源代码、文本代码基础数据和合成数据，总共5。5万亿代币。这导致代码相关任务的显著改进。📚了解更多：在增强编码能力的同时，我们的目标是保留基础模型在数学和通用功能方面的优势。

因此，Qwen 2. 5-Coder融合了有关数学和一般能力的额外数据，为Code Agent等现实世界应用程序提供了全面的基础。Qwen 2. 5-编码器：基本模型Qwen 2.

5-Coder支持多达128 K个上下文标记，涵盖92种编程语言，并在各种代码相关评估任务（包括代码生成、多编程代码生成、代码完成和代码修复）方面取得了显着改进。值得注意的是，Qwen 2的开源7 B版本。

5-Coder的性能甚至超过了DeepSeek-Coder-V2-Lite和CodeStral-22 B等大型型号，使其成为可用的最强大的基本代码型号之一。除了代码任务之外，Qwen 2. 5-Coder还在GSM 8 K和数学等评估中展示了有竞争力的数学能力。

对于一般任务，MMLU和ARC的评估显示Qwen 2. 5-Coder保留了Qwen 2的一般能力表现。5. Qwen 2. 5-Coder-Direcct：指导调整模型以Qwen 2为基础。

5-Coder，我们用指令数据对其进行了微调，创建了Qwen 2。5-编码器-指示。这种经过描述优化的模型不仅进一步提高了任务性能，而且还在各种基准测试中表现出出色的概括性。

Qwen 2. 5-Coder-Direct在几个关键领域表现出色：- 杰出多编程专家：我们使用McEval扩展了多语言评估，涵盖40多种编程语言。结果显示，Qwen 2. 5-Coder-Direct在许多语言中表现出色，包括小众语言。

- 代码推理：我们相信代码推理与一般推理技能密切相关。我们使用CRUXEval作为基准，结果显示Qwen 2。

5-Coder-Direct擅长代码推理任务。有趣的是，随着代码推理的提高，模型遵循复杂指令的能力也变得更好，这鼓励我们进一步探索代码如何增强一般技能。- 数学推理：数学和代码经常一起讨论：数学是代码的基础，而代码是数学的关键工具。

Qwen 2. 5-Coder-Direct在代码和数学任务方面都表现出色，被证明是一名“理科学生”。- 基本能力：我们还评估了一般能力，结果表明Qwen 2. 5-Coder-Direct保持了Qwen 2的优势。

5在一般能力方面。许可证Qwen 2. 5-Coder在Apache 2下发布。0许可证。我们希望这种开放性的提高能够加速其在代码智能中的应用。Qwen 2的下一步是什么。5-编码器？我们正在准备Qwen 2的32 B版本。

5-Coder，旨在挑战专有模型。敬请关注-它即将到来！此外，我们正在探索强大的以代码为中心的推理模型，以推动代码智能的边界。

引文@article{hui2024qwen2，title={Qwen 2. 5-编码器技术报告}，作者={辉、宾源和杨、简和崔、泽宇和杨、嘉熙和刘、达益恒和张、雷和刘、天玉和张、家俊和余、博文和党、凯等人}，journal={arXiv预印本arXiv：2409。

12186}，年={2024}}@article{yang2024qwen 2，title={Qwen 2技术报告}，作者={杨、安和杨、宝松和辉、宾远和郑、薄和余、博文和周、张和李、成鹏和李、成远和刘、达益恒和黄、飞等人}，journal={arXiv预印本arXiv：

2407。10671}，年={2024}}

原文出处

本文为机器翻译辅以 AI 润色，仅供参考。原始事实以原文为准。

相关阅读