【技术随谈】第5篇
【AI Agent vs Agentic AI】系列第1篇
人工智能技术正在经历从单一智能体向多智能体协同系统的革命性演进。本系列文章全面探讨了这一技术演进过程中的核心概念、架构差异、应用场景、现存挑战及未来发展方向。文章系统分析了AI智能体作为独立任务执行者的技术特征,以及多智能体协同系统通过专业化分工和动态协调所实现的系统级智能。通过剖析从客户服务到复杂决策支持等多样化应用场景,揭示了不同技术架构的适用边界与互补关系。同时深入探讨了当前技术面临的关键瓶颈,包括因果推理、系统协调等核心挑战,并提出了突破性的解决方案和发展路线图。随着基础框架的成熟和关键技术的突破,这一领域正在推动人工智能从工具属性向自主协作能力的质变,为人机协同的未来发展描绘出清晰的技术蓝图。
1.引言
自2022年11月ChatGPT发布以来,全球谷歌搜索数据显示"AI Agent"和Agentic AI"的搜索量出现显著的上升趋势,见下图。

最近1年以来的媒体文章也频繁出现“Agentic AI”,这跟过去常见的”AI Agent”有什么差别?从语法分析,Agentic为形容词,Agent为名词,究竟是不是一回事呢?在本篇,我们要详细地分析两者的本质区别,并回顾其历史脉络。
在此之前,我们先讨论一下两个词的中文名。“AI Agent”无论是学术界还是产业界,大多数时候都是翻译为:“AI智能体”,这个业内有共识。“Agentic AI”这个词出现的时间不长,中文语境里的翻译五花八门,有:自主AI、能动性AI、多智能体协同AI等。综合考虑中文语境习惯和内在的技术内涵,本系列文章暂定翻译为“多智能体协同AI”。
2.早期智能系统
早期智能体系统依赖预定义规则执行特定任务,仅具备有限自主性且难以适应动态环境。这些系统主要采用反应式或慎思式架构,基于符号推理、规则逻辑或脚本行为,而非现代AI智能体所具备的学习驱动与情境感知能力[1][2]。例如专家系统利用知识库和推理引擎模拟人类决策过程(如医疗诊断系统MYCIN[3])。其他典型案例包括分子结构预测系统DENDRAL[4]、计算机配置系统XCON[5]以及规则化生产系统框架CLIPS[6]。SOAR[7]和包容架构[8]等系统则将符号与反应逻辑延伸至认知建模和机器人领域。

图注:MYCIN医疗诊断系统示意图
除任务特定推理外,这些早期智能体支持有限形式的社会交互。ELIZA[9]和PARRY[10]等早期对话系统通过模式匹配和脚本响应模拟基础对话,但缺乏真实理解或情境适应能力。机器人领域的反应式智能体则基于固定控制规则执行感知-动作循环,如早期自主平台Stanford Cart[11]。

图注:Stanford Cart实拍图
多智能体系统促进分布式实体间的协调,典型如供应链管理中的拍卖式资源分配[12][13]。电子游戏中脚本化AI(如早期RPG的NPC行为)采用预定义决策树[14]。此外,信念-愿望-意图(BDI)架构支持软件智能体的目标导向行为,如空中交通管制模拟系统[15][16]。
然而这些系统普遍存在共性局限:缺乏自我学习能力、生成式推理以及对非结构化或演化环境的适应性。
3.现代智能系统的演进
学术界与产业界对AI智能体与多智能体协同AI的兴趣增长反映了系统能力的整体跃迁。这一转变与智能系统设计的演进密切相关:从2022年前在受限规则环境中运作的AI智能体,到后LLM时期以学习驱动、灵活/自适应架构为特征的系统。这些新系统使智能体能够随时间优化性能,并与非结构化动态输入自主交互。例如传统专家系统需手动更新静态知识库,而现代智能体利用涌现的神经架构实现跨任务泛化[17]。趋势活动的激增反映了人们对这一技术飞跃的认知提升,研究者与实践者寻求超越自动化、实现自主与通用推理的工具。
2022年11月ChatGPT的发布标志着人工智能发展与公众认知的关键转折点,引发全球范围内的应用热潮、投资增长与研究活跃度提升。在此突破性进展推动下,AI领域经历了从独立LLM使用向更自主的任务导向框架的快速转型。最初,ChatGPT的巨大成功催生了生成式智能体——这类基于LLM的系统专为根据用户提示生成文本、图像和代码等新颖输出而设计[18][19]。这些智能体迅速应用于各类场景,从对话助手(如GitHub Copilot[20])和内容生成平台(如Jasper[21])到创意工具(如Midjourney[22]),在2023年及以后彻底改变了数字设计、营销和软件原型开发等领域。
尽管"AI智能体"术语最早于1998年提出[23],但随着生成式AI的兴起其内涵已显著扩展。基于此生成基础,一类通常被称为AI智能体的新系统应运而生。这些智能体通过外部工具使用(如API工具)、函数调用和序列推理增强LLM能力,使其能自主检索实时信息并执行多步骤工作流[24][25]。AutoGPT[26]和BabyAGI等框架体现了这一转变,展示如何将LLM嵌入反馈循环以实现目标驱动环境中的动态规划、行动与适应[27][28]。

图注:AutoGPT工作流示意图
到2023年末,该领域进一步迈入多智能体协同AI范畴——由专业智能体协作分解目标、交流信息并协调完成共同目标的复杂多智能体系统。与此演进同步,谷歌于2025年提出智能体间协议(A2A)[29],该拟议标准旨在实现跨框架与供应商的智能体无缝互操作。该协议围绕五项核心原则构建:支持自主能力、基于现有标准、默认安全交互、支持长时任务和确保模态无关性。这些准则旨在为响应式、可扩展的自主基础设施奠定基础。

图注:Google A2A协议示意图
CrewAI等架构展示这些自主框架如何实现跨分布式角色的决策,在机器人、物流管理和自适应决策支持等高要求应用中促进智能行为[30][31][32][33]。

图注:CrewAI框架示意图
4.AI Agent与Agentic AI的本质差异
随着领域从生成式智能体向日益自主的多智能体协同AI系统演进,明确AI智能体与多智能体协同AI之间的技术与概念边界变得至关重要。虽然两种范式都基于LLM并扩展生成系统能力,但它们体现根本不同的架构、交互模型和自主水平。
AI智能体通常设计为单一实体系统,通过利用外部工具、应用序列推理和整合实时信息来完成明确定义的功能[34]。
相比之下,多智能体协同AI系统由多个专业智能体组成,它们在一个更广泛的工作流中协调、沟通并动态分配子任务以实现共同目标[35]。这种架构差异凸显了在可扩展性、适应性和应用范围上的显著区别。
5.结论
对这两种范式(AI智能体与多智能体协同AI)的差异进行厘清具有重要意义。首先,确保把AI智能体部署于模块化、工具辅助的任务,而多智能体协同AI用于编排式多智能体操作。其次,性能指标、安全协议和资源需求在专为执行个体任务设计的智能体与为完成复杂协调任务设计的分布式智能体系统间存在实质性差异。最后,优化智能系统的设计原则,避免产生这两类问题:对需要自主协调的复杂场景设计不足;对可用单个AI智能体解决的简单应用过度设计。
山石网科是中国网络安全行业的技术创新领导厂商,由一批知名网络安全技术骨干于2007年创立,并以首批网络安全企业的身份,于2019年9月登陆科创板(股票简称:山石网科,股票代码:688030)。
现阶段,山石网科掌握30项自主研发核心技术,申请540多项国内外专利。山石网科于2019年起,积极布局信创领域,致力于推动国内信息技术创新,并于2021年正式启动安全芯片战略。2023年进行自研ASIC安全芯片的技术研发,旨在通过自主创新,为用户提供更高效、更安全的网络安全保障。目前,山石网科已形成了具备“全息、量化、智能、协同”四大技术特点的涉及基础设施安全、云安全、数据安全、应用安全、安全运营、工业互联网安全、信息技术应用创新、安全服务、安全教育等九大类产品服务,50余个行业和场景的完整解决方案。