Qwen3-Coder发布:最强开源编程智能体模型
阿里云发布Qwen3-Coder系列,其中480B参数MoE模型在编程、浏览器使用和工具调用等智能体任务上达到开源SOTA,性能媲美Claude Sonnet 4,并配套开源命令行工具Qwen Code。
GITHUB HUGGING FACE MODELSCOPE DISCORD今天,我们宣布推出Qwen3-Coder,这是我们迄今为止最具智能体能力的代码模型。
Qwen3-Coder提供多种尺寸,但我们首先介绍其最强大的变体:Qwen3-Coder-480B-A35B-Instruct——一个480B参数的混合专家模型,具有35B活跃参数,原生支持256K token的上下文长度,并通过外推方法可扩展至1M token,
在编码和智能体任务中均表现出色。Qwen3-Coder-480B-A35B-Instruct在智能体编码、智能体浏览器使用和智能体工具使用方面,在开源模型中取得了新的最先进结果,与Claude Sonnet 4相当。
除了模型之外,我们还开源了一个用于智能体编码的命令行工具:Qwen Code。Qwen Code源自Gemini Code,经过定制提示和函数调用协议的调整,以充分释放Qwen3-Coder在智能体编码任务上的能力。
Qwen3-Coder与社区最好的开发者工具无缝协作。作为基础模型,我们希望它能在数字世界的任何地方使用——世界上的智能体编码!
Qwen3-Coder预训练预训练仍有扩展空间——通过Qwen3-Coder,我们正在多个维度推进,以增强模型的核心能力:- 扩展Token:7.5T token(70%代码比例),在编码方面表现出色,同时保留通用和数学能力。
- 扩展上下文:原生支持256K上下文,并可通过YaRN扩展到最多1M,针对仓库级别和动态数据(例如,拉取请求)进行了优化,以赋能智能体编码。- 扩展合成数据:利用Qwen2.5-Coder清理和重写噪声数据,显著提高整体数据质量。
后训练扩展代码RL:难以解决,易于验证与社区中普遍关注的竞赛级代码生成不同,我们认为所有代码任务都非常适合执行驱动的大规模强化学习。这就是为什么我们在更广泛的真实世界编码任务上扩展了代码RL训练。
通过自动扩展多样性编码任务的测试用例,我们创建了高质量的训练实例,并成功释放了强化学习的全部潜力。它不仅显著提高了代码执行成功率,还为其他任务带来了收益。这鼓励我们继续探索难以解决、易于验证的任务,作为大规模强化学习的沃土。
扩展长程RL在SWE-Bench等真实世界的软件工程任务中,Qwen3-Coder必须与环境进行多轮交互,涉及规划、使用工具、接收反馈和做出决策。在Qwen3-Coder的后训练阶段,我们引入了长程RL(智能体RL),以鼓励模型通过使用工具的多轮交互来解决真实世界任务。
智能体RL的关键挑战在于环境的可扩展性。为了解决这个问题,我们构建了一个可扩展的系统,能够并行运行20,000个独立环境,利用阿里云的基础设施。该基础设施为大规模强化学习提供必要的反馈,并支持大规模评估。
因此,Qwen3-Coder在SWE-Bench Verified上实现了开源模型中最先进的性能,而无需测试时扩展。
使用Qwen3-Coder编码Qwen CodeQwen Code是一个研究用途的命令行工具,改编自Gemini CLI,具有针对Qwen-Coder模型的增强解析器和工具支持。
确保您已安装nodejs 20+:您可以通过以下命令安装它:curl -qL https://www.npmjs.com/install.sh | sh然后通过npm管理器安装Qwen Code:
npm i -g @qwen-code/qwen-code另一种方法是从源码安装:
git clone https://github.com/QwenLM/qwen-code.gitcd qwen-code && npm install && npm install -gQwen Code在调用LLM时支持OpenAI SDK,
您可以导出以下环境变量或将其放在.env文件中:export OPENAI_API_KEY="your_api_key_here"export OPENAI_BASE_URL="https:
//dashscope-intl.aliyuncs.com/compatible-mode/v1"export OPENAI_MODEL="qwen3-coder-plus"现在,只需输入qwen即可享受使用Qwen Code和Qwen的Vibe编码!
Claude Code除了Qwen Code之外,您现在还可以将Qwen3-Coder与Claude Code一起使用。
只需在阿里云模型工作室平台上请求API密钥并安装Claude Code即可开始编码。npm install -g @anthropic-ai/claude-code我们提供了两个入口,可以无缝体验使用Qwen3-Coder进行编码。
选项1:Claude Code代理APIexport ANTHROPIC_BASE_URL=https:
//dashscope-intl.aliyuncs.com/api/v2/apps/claude-code-proxyexport ANTHROPIC_AUTH_TOKEN=your-dashscope-apikey那么您就可以将Claude Code与Qwen3-Cod
er一起使用了!选项2:用于路由器定制的claude-code-config npm包claude-code-router旨在为Claude Code定制不同的后端模型。
dashscope团队还提供了一个方便的配置npm扩展,即claude-code-config,它为具有DashScope支持的claude-code-router提供默认配置。
运行安装:npm install -g @musistudio/claude-code-routernpm install -g @dashscope-js/claude-code-config然后运行配置:
ccr-dashscope该命令将自动生成ccr的配置json文件和插件目录。(您也可以在~/.claude-code-router/config.json和~/.claude-code-router/plugins/下手动调整这些。
)通过ccr开始使用Claude Code:ccr codeCline将Qwen3-Coder-480B-A35B-Instruct配置到Cline:- 转到Cline配置设置- 对于API提供者,
选择“OpenAI Compatible”- 对于OpenAI Compatible API Key,输入从Dashscope获得的密钥- 勾选“Use custom base URL”并输入:https://dashscope-intl.
aliyuncs.com/compatible-mode/v1- 输入qwen3-coder-plus用例API您可以通过阿里云模型工作室直接访问Qwen3-Coder的API。
下面是如何使用Qwen API使用此模型的演示:import osfrom openai import OpenAI# 创建客户端 - 为中国以外的用户使用intl URL# 如果您在中国大陆,请使用以下URL:# "https:
//dashscope.aliyuncs.com/compatible-mode/v1"client = OpenAI( api_key=os.getenv("DASHSCOPE_API_KEY"),
base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)prompt = "Help me create a web page for an online bookstore."# 向qwen3-coder-plus模型发送请求completion = client.chat.completions.create( mode
l="qwen3-coder-plus",messages=[ {"role":"system","content":"You are a helpful assistant."},{"role":"user","content":prompt} ],
)# 打印响应print(completion.choices[0].message.content.strip())进一步工作我们仍在积极努力提高编码智能体的性能,旨在让它承担软件工程中更复杂和繁琐的任务,从而释放人类生产力。
更多尺寸的Qwen3-Coder即将推出,在提供强大性能的同时降低部署成本。此外,我们正在积极探索编码智能体是否能够实现自我改进——这是一个令人兴奋且鼓舞人心的方向。