AI术语全解析:从AGI到微调,一文读懂
本文是TechCrunch发布的AI术语表,系统解释了AGI、AI智能体、思维链、扩散模型等常见术语,帮助读者理解AI领域的关键概念。
人工智能正在改变世界,同时也在发明一套全新的语言来描述它的运作方式。花五分钟阅读关于AI的内容,你就会遇到LLM、RAG、RLHF等十几个术语,这些术语甚至会让科技界非常聪明的人感到不自信。本术语表是我们试图解决这个问题的尝试。
随着该领域的发展,我们会定期更新它,因此请将其视为一份活文档,就像它所描述的AI系统一样。AGI人工通用智能(AGI)是一个模糊的术语,但它通常指的是在许多(如果不是大多数)任务上比普通人类更有能力的AI。
OpenAI CEO Sam Altman曾将AGI描述为“相当于一个中等水平的人类,你可以雇佣他作为同事”。与此同时,OpenAI的章程将AGI定义为“在大多数经济价值最高的工作中表现优于人类的高度自主系统”。
Google DeepMind的理解与这两个定义略有不同;该实验室将AGI视为“在大多数认知任务上至少与人类能力相当的AI”。感到困惑?别担心——AI研究前沿的专家们也同样困惑。
AI智能体AI智能体指的是一种利用AI技术代表你执行一系列任务的工具——超越了更基础的AI聊天机器人所能做的事情——例如报销费用、预订机票或餐厅餐桌,甚至编写和维护代码。
然而,正如我们之前解释过的,这个新兴领域中有很多动态因素,因此“AI智能体”对不同的人可能意味着不同的东西。实现其设想能力所需的基础设施也仍在建设中。但基本概念指的是一个自主系统,它可能利用多个AI系统来执行多步骤任务。
API端点将API端点视为软件背面的“按钮”,其他程序可以按下这些按钮来使其执行操作。开发者使用这些接口来构建集成——例如,允许一个应用程序从另一个应用程序拉取数据,或者使AI智能体能够直接控制第三方服务,而无需人工手动操作每个接口。
大多数智能家居设备和连接平台都有这些隐藏的按钮可用,即使普通用户从未看到或与之交互。随着AI智能体能力越来越强,它们越来越能够自行发现和使用这些端点,为自动化开辟了强大——有时甚至意想不到——的可能性。
思维链面对一个简单的问题,人类大脑甚至无需过多思考就能回答——比如“哪种动物更高,长颈鹿还是猫?”但在许多情况下,你通常需要纸和笔才能得出正确答案,因为存在中间步骤。
例如,如果一个农民有鸡和牛,它们总共有40个头和120条腿,你可能需要写下一个简单的方程才能得出答案(20只鸡和20头牛)。在AI背景下,大型语言模型的思维链推理意味着将问题分解为更小的中间步骤,以提高最终结果的质量。
通常需要更长时间才能得到答案,但答案更可能是正确的,尤其是在逻辑或编码场景中。推理模型是从传统大型语言模型发展而来,并通过强化学习针对思维链思维进行了优化。(参见:大型语言模型)编码智能体这是一个比“AI智能体”更具体的概念,指的是能够自主采取行动、逐步完成目标的程序。
编码智能体是应用于软件开发的专门版本。编码智能体不是简单地建议代码供人类审查和粘贴,而是可以自主编写、测试和调试代码,处理通常占据开发者一天时间的迭代、试错工作。这些智能体可以在整个代码库中操作,发现错误、运行测试并在最少的人工监督下推送修复。
可以把它想象成雇佣一个速度极快、从不睡觉、从不分心的实习生——不过,和任何实习生一样,人类仍然需要审查其工作。
计算虽然这个词有些多义,但“计算”通常指的是使AI模型运行的关键计算能力。这种类型的处理为AI行业提供动力,使其能够训练和部署强大的模型。该术语通常是提供计算能力的硬件类型的简称——例如GPU、CPU、TPU以及其他构成现代AI行业基石的基础设施形式。
深度学习深度学习是自我改进机器学习的一个子集,其中AI算法采用多层人工神经网络(ANN)结构设计。与更简单的基于机器学习的系统(如线性模型或决策树)相比,这使它们能够进行更复杂的关联。深度学习算法的结构从人脑中神经元的互连路径中汲取灵感。
深度学习AI模型能够自行识别数据中的重要特征,而不需要人类工程师来定义这些特征。该结构还支持能够从错误中学习,并通过重复和调整过程改进自身输出的算法。然而,深度学习系统需要大量数据点(数百万或更多)才能产生良好结果。
与更简单的机器学习算法相比,它们通常需要更长的训练时间——因此开发成本往往更高。
(参见:神经网络)扩散扩散是许多艺术、音乐和文本生成AI模型的核心技术。受物理学启发,扩散系统通过添加噪声慢慢“破坏”数据的结构——例如照片、歌曲等——直到什么都不剩。在物理学中,扩散是自发且不可逆的——扩散到咖啡中的糖无法恢复成方块形式。
但AI中的扩散系统旨在学习一种“反向扩散”过程来恢复被破坏的数据,从而获得从噪声中恢复数据的能力。蒸馏蒸馏是一种通过“教师-学生”模型从大型AI模型中提取知识的技术。开发者向教师模型发送请求并记录输出。
有时会将答案与数据集进行比较以检查准确性。这些输出随后用于训练学生模型,该模型被训练以近似教师的行为。蒸馏可用于在较大模型的基础上创建更小、更高效的模型,且蒸馏损失最小。这很可能就是OpenAI开发GPT-4 Turbo(GPT-4的更快版本)的方式。
虽然所有AI公司都在内部使用蒸馏,但一些AI公司也可能使用蒸馏来追赶前沿模型。从竞争对手处进行蒸馏通常违反AI API和聊天助手的服务条款。
微调微调是指对AI模型进行进一步训练,以优化其在比之前训练重点更具体的任务或领域上的性能——通常通过输入新的、专门的(即面向任务的)数据。
许多AI初创公司以大型语言模型为起点来构建商业产品,但也在竞相通过基于自身领域特定知识和专业知识的微调来补充早期训练周期,以增强目标行业或任务的实用性。
(参见:大型语言模型[LLM])GANGAN(生成对抗网络)是一种机器学习框架,支撑了生成式AI在生成逼真数据方面的一些重要发展——包括(但不限于)深度伪造工具。GAN涉及使用一对神经网络,其中一个利用其训练数据生成输出,传递给另一个模型进行评估。
这两个模型本质上被编程为试图超越对方。生成器试图让其输出通过判别器,