Agent,Agentic AI,到底走到到哪了?

发布时间:2025-10-16 10:57  浏览量:1

当 AI 不再只是“被调用”,而是主动“发起任务”,我们是否准备好接受一个有“意图”的系统?本文试图打破“AI=工具”的认知惯性,从 Agentic AI 的能力边界、协作机制与风险结构出发,重新思考人机关系的未来走向。

模型为什么要Agent

想想目前基础的大语言模型,擅长各式各样的文字处理能力,在真实的复杂场景中却很难胜任。简单场景下的被动响应难以处理高难度任务以及实时互动等。通用引入Agent,AI就能自主行动、适应环境,像虚拟同事一样评估可能后果,再做具体的决策。比如,Agent能追求目标、完成任务,还能带上推理、规划及记忆功能。这样一来,补足了LLM和RAG的短板,提供模型在真实世界中的执行力和决策能力。最终,能够解锁新的业务范式、加速生产力,将AI从工具变成与你一起解决问题的伙伴。尤其在当前生成式AI前沿,Agent被视为下一个突破——无缝与人类进行任务协作。

从技术上进行分析,LLM本身受限于上下文窗口大小处理长序列时容易丢失信息,且无法直接调用该外部API或工具。Agent的工具集成机制,比如Function calling(函数调用),让模型动态选择并执行外部操作来扩展能力。加上向量数据库存储的长期记忆,避免每次从零开始。像经典的ReAct(Reason + Act)范式,模型先推理再行动,训练优化输出,解决但不预测的局限。在不确定环境中整体提升了鲁棒性和泛化能力。

NVIDIA强调LLM-powered agents用规划、记忆和工具来推理问题、创建计划并执行任务。

Agent架构如何

先说最基础的,Agent像软件程序一样能够与环境互动、收集数据、执行自导任务。

核心就是在于循环:观察、思考、行动、学习(不断迭代)。

内部结构通常包括LLM决定控制流,加上记忆、函数和路由器组件。

常见模式有:顺序执行、并发处理、群聊协作、手动切换。Agentic架构更强调自治,减少用户的输入,让AI基于目标独立决策。

深入点来说,典型架构分:Perception(感知层)、Brain(大脑层)、Action(行动层)。感知层用传感器或API输入数据,大脑层靠LLM处理,结合Chain-of-Thought(CoT)提示词工程来分解任务。记忆分成短期(上下文窗口)和长期(向量存储),支持RAG。行动层主要是通过工具库进行调用(MCP,API等)。框架如LangChain提供链式构建,AutoGen支持多代理协作,模拟人类团队分工。路由组件用语义路由器决定下一步,优化效率。Agentic版本强调零样本学习,模型不需额外训练就能适应新任务。

当前Agent容易出现的问题

尽管潜力大,Agent还是碰上不少坑。信任和偏见问题常见,缺乏伦理责任,容易依赖不完美模型导致风险。 比如,不是人类,就难在复杂场景即兴解决,缺移情能力。 记忆弱点突出,每次对话重置,无连续学习。 LLM核心带来的幻觉等毛病,也放大在Agent上。 编码Agent常制造技术债务,代码难调试。 目标不对齐风险大,如果设计不当,结果偏离预期。 隐私合规尤其棘手,在医疗等行业更明显。 失败多因没把握AI能力边界和失败模式。

技术端分析:幻觉源于LLM概率生成,Agent循环放大错误,导致行动偏差。 内存管理问题如溢出或检索不准,影响长期一致性,浅层记忆导致无连续学习。

产品端分析:隐私和安全高风险,自治agent易泄露数据,尤其在业务中。 准确率低于70%在客服等工作,失败创建功能API。

近期Agent提升——Agentic AI

转到2025年,Agentic AI这个概念爆火。UiPath的Agentic Automation被评为年度最佳发明,简化业务的同时能够进行多代理的管理。

Agentic AI主要是想在有限监督下完成特定目标的自治AI系统,且能独立行动执行过程。当前最新的有关Agentic的公司咨询:

UiPath:AgenticAutomation协调复杂工作流,agent、机器人和人类协作。针对银行(贷款origination)、医疗(claimsprocessing)、保险(underwriting)和制造(优化throughput)。Anthropic:ClaudeSonnet4.5优化为agent、coding和计算机使用。针对安全研究如agenticmisalignment,和经济指数应用。最新ClaudeAgentSDK提供上下文管理、工具生态、权限控制,用于构建编码代理如SRE诊断、生产问题修复,或业务代理如法律审查、财务分析。DeepMind:CodeMender作为代码安全AIagent,GeminiRobotics1.5将agent带入物理世界。针对机器人本地设备和代码修复场景。Microsoft:CopilotStudio构建和部署AIagents,集成到Microsoft365。针对工作流自动化如文档总结、数据分析和会议转录,跨行业如安全和编码。IBM:watsonxAssistant创建无代码虚拟agents,watsonxOrchestrateoffload重复工作。针对企业生产力提升和工作流加速。AWS:AmazonQ等工具支持agentic自动化,针对云基础的业务转型。OpenAI:10月6日推出AgentKit,包含AgentBuilder视觉画布构建多代理工作流、ConnectorRegistry管理数据连接、ChatKit嵌入聊天体验。扩展Evals功能如数据集、追踪评分、提示优化,支持第三方模型。针对深度研究、客服、销售代理等场景,Ramp和LYCorporation快速构建采购和工作助手代理。

Tencent:企点营销云9月推出MagicAgent,全链路营销智能化,帮助企业快速构建多技能AI营销代理。整合场景化AI代理策略全景,AgentDevelopmentPlatform3.0全球发布,支持营销工具全面AI化,针对营销场景如消费者互动、内容生成。

LYCorporation:5月宣布AI代理策略,10月转向领域系统加速引入。利用OpenAI工具构建工作助手代理,AgentOne企业级平台提供自治代理,针对用户服务如LINE和Yahoo!JAPAN的生成AI功能,提升内部应用和业务用户体验。

引用来源

NVIDIA LLM驱动的AI代理介绍:https://www.nvidia.com/en-us/ai/

Anthropic Claude代理SDK构建指南:https://www.anthropic.com/engineering/building-agents-with-the-claude-agent-sdk

AWS AI代理官方页面:https://aws.amazon.com/bedrock/agents/

IBM AI代理主题概述:https://www.ibm.com/think/topics/ai-agents

逻辑理论家AI程序历史:https://en.wikipedia.org/wiki/Logic_Theorist

人工智能历史早期发展:https://en.wikipedia.org/wiki/History_of_artificial_intelligence

基于规则的专家系统:https://en.wikipedia.org/wiki/Expert_system

智能代理1990年代发展:https://en.wikipedia.org/wiki/Intelligent_agent

Transformer架构介绍:https://en.wikipedia.org/wiki/Transformer_%28deep_learning_architecture%29

LLM驱动的自治代理系统:https://lilianweng.github.io/posts/2023-06-23-agent/

Agentic AI融合与兴起:https://docs.aws.amazon.com/prescriptive-guidance/latest/agentic-ai-foundations/agentic-ai-emergence.html

AI代理偏见与训练数据报告:https://www.nist.gov/news-events/news/2022/03/theres-more-ai-bias-biased-data-nist-report-highlights

强化学习中的Goodhart定律:https://www.alignmentforum.org/posts/Eu6CvP7c7ivcGM3PJ/goodhart-s-law-in-reinforcement-learning

Agentic AI概念定义:https://www.ibm.com/think/topics/agentic-ai

UiPath Agentic自动化平台:https://www.uipath.com/automation/agentic-automation

本文由 @天故有白 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自Unsplash,基于CC0协议