介绍Qwen
在我们首次发布Qwen-7 B(这是我们大型语言模型(LLM)开源之旅的起点)4个月后,我们现在介绍Qwen系列,让您全面了解我们的工作以及我们的目标。以下是我们开源项目和社区的重要链接。
Paper Gupub拥抱脸模型Scope Discord此外,我们还有用于聊天的微信群,我们邀请您通过GitHub readme中提供的链接加入群。概述总的来说,Qwen不仅仅是一个语言模型,而是一个面向AGI的项目,目前该项目由LLM和LMM组成。
下图显示了Qwen的主要组成部分:其中Qwen指的是基本语言模型,而Qwen-Chat指的是使用SFT和WLHF等技术训练的聊天模型。我们还有专门针对领域和任务的模型,例如用于编码的Code-Qwen和用于数学的Math-Qwen。
LLM可以通过情态对齐扩展到多情态,因此我们有视觉语言模型Qwen-BL和音频语言模型Qwen-Audio。请注意,该博客主要用于介绍语言模型。至于大型多模式模型(LMM),例如Qwen-BL和Qwen-Audio,请参阅各自的博客。
基础模型:调整的良好起点建立辅助模型的一般过程包括训练前和训练后,后者主要由SFT和RL HF组成。
至于预训练,与之前的LLM、GPT-3、Llama类似,Qwen是一个基于Transformer的语言模型,通过下一个令牌预测任务预训练。为了简单性和稳定性,我们没有为语言模型引入更多任务,而是专注于模型大小扩展和数据扩展。
目前,我们已经开发了5个不同尺寸的型号,其中4个是开源的。特别是,我们现在发布Qwen-1。8B、Qwen-7B、Qwen-14B和Qwen-72B。模型已经用2-3万亿个令牌进行了充分的训练。
预训练数据是多语言的,因此Qwen本质上是一个多语言模型,而不是单一语言或双语模型。请注意,由于我们的预训练数据的限制,该模型能够很好地支持英语和中文,也能够支持其他语言,如西班牙语,法语和日语。
为了扩展其多语言功能,我们应用了高效的标记化器来编码来自不同语言的信息。与其他标记器相比,我们的标记器在一系列语言中表现出高压缩率。我们预训练的另一个重点是上下文长度的扩展。我们直接为RoPE应用具有更长上下文长度和更大基础值的持续预训练。
此外,我们发现这一点。这种方法在外推中也很有效。现在我们的开源模型主要支持32 K代币的上下文长度,并且通过L-Eval和“干草堆中的针”进行了评估。
基准评估表明,我们最大的开源模型Qwen-72 B以及最大的专有模型与Llama 2,GPT-3相比表现出竞争力。5和GPT-4。请注意,这是对基本语言模型的评估。这只反映了我们可能有一个很好的起点进行后期培训,即。
e.、SFT和WLHF。对准我们在训练后将这两种技术称为“对齐”一词。目前,人们一致认为我们可以通过相对少量的微调数据来获得聊天模型。我们专注于提高SFT数据的多样性和复杂性(instag和tulu 2),通过手动检查和自动评估严格控制质量。
基于良好的SFT模型,我们可以探索RL HF的影响。训练RL HF很困难,特别是基于PPO的方法,除了PPO的训练不稳定性之外,最终表现的另一个关键是奖励模型的质量。
因此,我们致力于通过对大规模比较数据进行奖励模型预训练并对精心标记的高质量比较数据进行微调来构建可靠的奖励模型。与SFT模型相比,我们发现RL HF模型更有创意,更好地遵循指令,因此其生成的响应更受人类注释者的青睐。
工具使用和代理当今LLM最令人惊叹的部分之一是工具使用和代理播放的能力。
我们直接标记ReAct格式的数据,以赋予生成思想和行动以及基于之前的步骤和观察生成响应的能力。此外,该模型直接学习上下文学习能力,因此可以通过理解指令和演示来使用未见过的工具。
我们目前支持函数调用、代码解释器和拥抱面部代理,它们分别用于工具使用、数据分析和使用人工智能模型来实现不同的输出,例如图像生成。
此外,基于我们的代理框架,我们进一步遵循GPT构建了一个名为AgentFabric的项目,该项目允许您只需与我们的模型聊天即可为自己构建一个专门的人工智能代理进行配置。总结我们发布了Qwen系列,在这个博客中,我们提供了Qwen语言模型的简单介绍。
现在,我们仍在遵循预训练、SFT和WLHF的食谱,并且我们正在寻找扩展模型和数据的途径。我们希望我们的开源能够为研究和应用社区做出贡献。引文如果您发现我们的工作有帮助,请随时向我们推荐!
@article{qwen,title={Qwen技术报告},作者={白金泽、白帅、楚云飞、崔泽宇、党凯、邓晓东、杨帆、葛文斌、宇瀚、黄飞、惠宾源、罗继、李梅、林俊洋、林润吉、刘大益恒和刘高和陆成强、陆克明、马建新和门瑞、任兴章、谭传奇、谭思南、屠建红、
王鹏和王俊杰以及王伟、吴胜光、徐本峰、徐金、杨安、杨建、杨树生、杨瑶、余博文、袁洪益、郑元、张建伟、张兴轩、张毅昌、张振如、周常、周景仁、周晓焕、朱天航journal={arXiv预印本arXiv:2309。
16609},年={2023}}