AI 见闻
精选· 重要性 4/5

Qwen-MT:速度与智能翻译的结合,支持92种语言

Qwen Team Blog··约 5 分钟阅读
中文导读

Qwen-MT是阿里云基于Qwen3和强化学习推出的新一代机器翻译模型,支持92种语言,在翻译质量和速度上超越GPT-4.1-mini等模型,并通过轻量级MoE架构降低API成本。

介绍我们通过Qwen API介绍Qwen-MT(qwen-mt-turbo)的最新更新。此次更新以强大的Qwen3为基础,利用数万亿多语言和翻译token,全面增强模型的多语言理解和翻译能力。

通过集成强化学习技术,该模型在翻译准确性和语言流畅性方面实现了显著提升。主要特点:- 支持92种语言的多语言支持:Qwen-MT支持92种主要官方语言和主要方言的高质量翻译,覆盖全球95%以上的人口,满足多样化的跨语言沟通需求。

- 高可定制性:新版本提供高级翻译功能,例如术语干预、领域提示和翻译记忆。通过启用可定制的提示工程,它提供针对复杂、特定领域和任务关键型应用场景量身定制的优化翻译性能。

- 低延迟和成本效率:通过利用轻量级的专家混合(MoE)架构,Qwen-MT实现了高翻译性能、更快的响应时间和显著降低的API成本(低至每百万输出token 0.5美元)。这特别适合高并发环境和延迟敏感的应用。

翻译质量自动评估我们在多领域翻译基准上评估了Qwen-MT,特别是中英和英德翻译,以及WMT24多语言翻译基准。实验结果表明,Qwen-MT的性能显著优于包括GPT-4.1-mini、Gemini-2.5-Flash和Qwen3-8B在内的同等规模模型。

值得注意的是,即使与GPT-4.1、Gemini-2.5-Pro和Qwen3-235B-A22B等最先进的大型语言模型相比,Qwen-MT也保持了具有竞争力的翻译质量,同时其优化的轻量级架构实现了快速的翻译处理。

人工评估自动评估方法有其固有的局限性,我们进一步实施了人工评估协议,利用十种主要语言的真实翻译数据:中文、英文、日文、韩文、泰文、阿拉伯文、意大利文、俄文、西班牙文和法文。

我们严格的评估框架涉及三名独立的专业翻译人员对每个测试样本进行评分,然后进行系统的交叉验证程序,以确保评估结果的客观性和可靠性。值得注意的是,Qwen-MT实现了卓越的性能指标,在接受率和优秀率方面都表现出显著优势,验证了其在实际部署场景中卓越的翻译能力。

以下是一些翻译示例:语言支持如何使用您可以通过Qwen API轻松使用Qwen-MT。

这里我们以一个从中文翻译成英文的简单场景为例。import osfrom openai import OpenAIclient = OpenAI( api_key=os.getenv("DASHSCOPE_API_KEY"),base_url="https:

//dashscope-intl.aliyuncs.com/compatible-mode/v1",

)messages = [ { "role":"user","content":"我看到这个视频后没有笑" }]translation_options = { "source_lang":"auto","target_lang":

"English"}completion = client.chat.completions.create( model="qwen-mt-turbo",

messages=messages,extra_body={ "translation_options":translation_options })print(completion.choices[0].message.content)Qwen-MT支持术语干预、

领域提示和翻译记忆等功能。例如,在涉及专业术语的翻译场景中,用户可以预定义关键术语对,并将它们作为参数注入到模型中,确保在整个输出中一致应用用户指定的词典。

import osfrom openai import OpenAIclient = OpenAI( api_key=os.getenv("DASHSCOPE_API_KEY"),base_url="https:

//dashscope-intl.aliyuncs.com/compatible-mode/v1",

)messages = [ { "role":"user","content":"而这套生物传感器运用了石墨烯这种新型材料,它的目标物是化学元素,敏锐的\"嗅觉\"让它能更深度、准确地体现身体健康状况。

" }]

]translation_options = { "source_lang":"Chinese","target_lang":"English","terms":[ { "source":"生物传感器","target":"biological sensor" },

{ "source":"石墨烯","target":"graphene" },{ "source":"化学元素","target":"chemical elements" },{ "source":"身体健康状况","target":

"health status of the body" } ]}completion = client.chat.completions.create( model="qwen-mt-turbo",

messages=messages,extra_body={ "translation_options":translation_options })print(completion.choices[0].message.content)# Response:

# This biological sensor uses graphene,a new material,

and its target is chemical elements. Its sensitive "nose" can more deeply and accurately reflect the health status of the body.此外,

翻译风格必须适应上下文的细微差别。例如,在法律和官方背景下,正式语体是必要的,而社交媒体交流则需要对话语气。为了确保适当的风格适应,用户可以在源文本旁边以自然语言提供上下文细节和风格偏好。

import osfrom openai import OpenAIclient = OpenAI( api_key=os.getenv("DASHSCOPE_API_KEY"),base_url="https:

//dashscope-intl.aliyuncs.com/compatible-mode/v1",

)messages = [ { "role":"user","content":"第二个SELECT语句返回一个数字,表示在没有LIMIT子句的情况下,第一个SELECT语句返回了多少行。

" }]translation_options = { "source_lang": "Chinese", "target_lang": "English", "domains": "The sentence is from Ali Cloud IT domain."

It mainly involves computer-related software development and usage methods,

including many terms related to computer software and hardware. Pay attention to professional troubleshooting terminologies and sentence

patterns when translating. Translate into this IT domain style."}completion = client.chat.completions.create( model="qwen-mt-turbo",

messages=messages,extra_body={ "translation_options":translation_options })print(completion.choices[0].message.content)# Response:

# The second SELECT statement returns a number that indicates how many rows were returned by the first SELECT statement without LIMIT cl

ause.有关更多高级功能,请参阅Qwen API。结论Qwen-MT是一种先进的机器翻译模型,支持92种语言之间的翻译。它旨在通过API为全球用户提供智能、灵活、高效的翻译体验。虽然“信、达、雅”仍然是一个充满挑战的持续旅程,但我们仍在不断探索和改进。

展望未来,我们将继续提高翻译的准确性和自然性,扩大覆盖范围到更多语言,最终消除语言障碍,实现真正的无国界沟通。

原文出处
Qwen-MT: Where Speed Meets Smart Translation

本文为机器翻译辅以 AI 润色,仅供参考。原始事实以原文为准。

相关阅读