Qwen 2.5-Coder:编码更多,了解更多!
GABRIB拥抱脸模型镜演示DISCORD介绍四月初,我们推出了CodeQwen 1。5,引起了社区的高度关注。从那时起,我们一直在努力增强编码模型。今天,我们很高兴地宣布发布下一代开源编码模型Qwen 2。
5-Coder,并正式将CodeQwen更名为Qwen-Coder。我们认为“Coder”更人性化、更敏捷,反映了我们未来成为真正编码合作伙伴的愿景。Qwen 2. 5-Coder是Qwen 2的一部分。
5系列,有三种型号尺寸可选:1. 5 B、7 B和32 B版本(即将推出)。此次更新重点关注两项主要改进:扩大代码训练数据和增强编码能力,同时保持数学和一般任务等其他核心领域的强劲性能。收件箱代码更多:Qwen 2。
5-Coder建立在强大的Qwen 2之上。5并继续训练更大规模的代码数据,包括源代码、文本代码基础数据和合成数据,总共5。5万亿代币。这导致代码相关任务的显著改进。📚了解更多:在增强编码能力的同时,我们的目标是保留基础模型在数学和通用功能方面的优势。
因此,Qwen 2. 5-Coder融合了有关数学和一般能力的额外数据,为Code Agent等现实世界应用程序提供了全面的基础。Qwen 2. 5-编码器:基本模型Qwen 2.
5-Coder支持多达128 K个上下文标记,涵盖92种编程语言,并在各种代码相关评估任务(包括代码生成、多编程代码生成、代码完成和代码修复)方面取得了显着改进。值得注意的是,Qwen 2的开源7 B版本。
5-Coder的性能甚至超过了DeepSeek-Coder-V2-Lite和CodeStral-22 B等大型型号,使其成为可用的最强大的基本代码型号之一。除了代码任务之外,Qwen 2. 5-Coder还在GSM 8 K和数学等评估中展示了有竞争力的数学能力。
对于一般任务,MMLU和ARC的评估显示Qwen 2. 5-Coder保留了Qwen 2的一般能力表现。5. Qwen 2. 5-Coder-Direcct:指导调整模型以Qwen 2为基础。
5-Coder,我们用指令数据对其进行了微调,创建了Qwen 2。5-编码器-指示。这种经过描述优化的模型不仅进一步提高了任务性能,而且还在各种基准测试中表现出出色的概括性。
Qwen 2. 5-Coder-Direct在几个关键领域表现出色:- 杰出多编程专家:我们使用McEval扩展了多语言评估,涵盖40多种编程语言。结果显示,Qwen 2. 5-Coder-Direct在许多语言中表现出色,包括小众语言。
- 代码推理:我们相信代码推理与一般推理技能密切相关。我们使用CRUXEval作为基准,结果显示Qwen 2。
5-Coder-Direct擅长代码推理任务。有趣的是,随着代码推理的提高,模型遵循复杂指令的能力也变得更好,这鼓励我们进一步探索代码如何增强一般技能。- 数学推理:数学和代码经常一起讨论:数学是代码的基础,而代码是数学的关键工具。
Qwen 2. 5-Coder-Direct在代码和数学任务方面都表现出色,被证明是一名“理科学生”。- 基本能力:我们还评估了一般能力,结果表明Qwen 2. 5-Coder-Direct保持了Qwen 2的优势。
5在一般能力方面。许可证Qwen 2. 5-Coder在Apache 2下发布。0许可证。我们希望这种开放性的提高能够加速其在代码智能中的应用。Qwen 2的下一步是什么。5-编码器?我们正在准备Qwen 2的32 B版本。
5-Coder,旨在挑战专有模型。敬请关注-它即将到来!此外,我们正在探索强大的以代码为中心的推理模型,以推动代码智能的边界。
引文@article{hui2024qwen2,title={Qwen 2. 5-编码器技术报告},作者={辉、宾源和杨、简和崔、泽宇和杨、嘉熙和刘、达益恒和张、雷和刘、天玉和张、家俊和余、博文和党、凯等人},journal={arXiv预印本arXiv:2409。
12186},年={2024}}@article{yang2024qwen 2,title={Qwen 2技术报告},作者={杨、安和杨、宝松和辉、宾远和郑、薄和余、博文和周、张和李、成鹏和李、成远和刘、达益恒和黄、飞等人},journal={arXiv预印本arXiv:
2407。10671},年={2024}}