到了2025年,智能体再次成为大厂追逐的猎物

三易生活 2025-04-29 20:45:55

最近一段时间,日新月异的AI圈最热门的词汇非Agent(智能体)、MCP莫属。百度创始人李彦宏不久前就在Create2025百度AI开发者大会上布道,“现在基于MCP开发智能体,就像2010年开发移动App”,仿佛遍地都是机会的蓝海又回来了。

国内AI初创公司Manus带来的启发,以及海外AI独角兽Anthropic的MCP(模型上下文协议)被开发者群体认可,代理人类执行任务的Agent似乎终于有了从“玩具”进化为“工具”的可能性。随着百度“心响”、字节跳动“扣子空间”等通用型智能体的问世,也让智能体有了从“人工智障”蜕变为能闭环处理复杂任务AI管家的曙光。

无独有偶,在海外市场微软发布的《2025工作趋势指数》报告中,也竭尽所能地渲染智能体的重要性。在这一报告中,微软方面表示,由智能体+人类的“人机协作”模式正在重塑企业架构,一种全新形态的“前沿公司”诞生,并且随着智能体的广泛应用,前沿公司中的每个员工都可能成为“智能体老板”,负责管理、培训和优化这些智能体。

微软还进一步指出,人与智能体的协作将会重塑我们的工作方式,以动态目标为导向的“任务协作图”(WorkChart)模式,则即将取代传统公司的组织结构。据悉,在该模式下,企业主要围绕目标、而非职能组建,借助智能体的整合跨领域能力来实现快速响应与高效协作,这一运作逻辑就类似于电影制作中按需组建、任务完成后解散的项目制团队。

其实智能体并非一个新概念,在此前的“百模大战”方兴未艾时,它就已经成为了AI行业的热点。而智能体之所以会被热议,得益于业界对于它的定义充满了想象空间。智能体被认为是一个可以自主感知、规划决策、执行复杂任务的产品,与传统大模型相比,智能体能够独立思考、并采取行动,而不需要依赖于人类的提示。

由于智能体能够作为人类的代理执行各种目标,也就意味着未来人类只需要“头脑风暴”,负责更复杂、更具战略性的工作即可,实施则交由智能体自动完成,从而将人类从繁琐的重复性、程序化工作中解脱出来。

都说AI是第四次工业革命,但这说的并不是ChatGPT等对话式大模型、而是智能体。

既然如此,为什么智能体真正被AI厂商大规模推广是在2025年,而不是2023年呢?其实这是因为直到2025年,智能体所需的三大关键组件,即规划(Planning)、记忆(Memory)、工具(Tools)才完成进化,拥有了商业化产品的可能。这也是为什么目前各大厂商在宣传自家智能体时,会特意强调“通用”的原因。

用微软CEO纳德拉的话来说,具备执行能力的通用智能体就是在为用户搭建一个脚手架,并在上面放好趁手的工具。以往的智能体只专精于特定领域,比如让许多人不堪其扰的智能营销机器人就是个典型的智能体,由基座大模型搭配智能客服、智能外呼、客户洞察等模块构成。

能用但不够好用,且应用场景有限,这就是以往智能体难以被推广的关键。如果用户发现智能体这也不行、那也不好用,市场教育显然也就难以推进。到了2025年,智能体所需要的长期记忆以及工具实现突破,它才有了成为“牛马”的可能。

过去智能体尽管在处理单个任务时表现出色,但在跨任务时却常常出现记忆断裂的问题,从而导致偏离最初的目标。大家不妨试想一下,一个丢三落四的人必然无法胜任复杂工作。而AI的“记忆”机制,则是由一个被称为"上下文窗口"(Context Window)的机制来管理,后者实质上是Transformer架构中的注意力机制能够处理的序列长度。

就像人类会有“好记性不如烂笔头”一样,AI也有“笔记”来扩展它的记忆能力,这就是检索增强生成(RAG)技术,其能够帮助AI突破原有的记忆界限。例如,国内AI独角兽月之暗面的Kimi智能助手在去年春季爆红,靠的就是将大模型的无损上下文处理能力从20万字跃升至200万字,从而开启了大模型的“长文本”时代。

时至今日,AI大模型的上下文处理能力基本都是百万字起步,基本解决了智能体记忆力有限的缺陷。同时Manus的出现也为智能体使用外部工具提供了启发,让业界意识到OpenAI的Operator、Claude的Computer Use等基于视觉识别能力,让智能体像人类一样观察屏幕的路线并不具备价值。

尽管Manus的缺陷,在于每调用一个外部工具就需要编写一个函数,导致其所需消耗的Token数量畸高。这时候AI开发者发现了Anthropic在去年11月末提出的开源协议MCP,为AI模型与外部工具之间的交互提供了一个标准化接口。

事实上,MCP就相当于是AI业界的“USB接口”,对于外部工具的开发者来说,支持MCP就会带来新的增量,而对于AI开发者,MCP的出现让自己不再需要将外部工具嵌入到自家产品中。因此从海外的OpenAI、谷歌、Meta,到国内市场的字节跳动、阿里、腾讯,几乎所有的业界大厂都捏着鼻子认可了Anthropic的MCP。

如今,超长的上下文理解和MCP为智能体就插上了一双翅膀,前者保证了智能体可以记住复杂的任务,后者则让智能体能够利用丰富的工具。既然已经万事俱备,AI厂商当然就要发力通用智能体了。毕竟传统对话式聊天机器人的变现潜力已经挖掘殆尽,即便强如ChatGPT的付费渗透率也仅仅只有5%。

如果说AI聊天机器人使用价值有限,那么能够完成各种工作的智能体,才是真正能够让个人用户和企业客户一掷千金的“聚宝盆”。

0 阅读:33

三易生活

简介:专注IT,最快最专业资讯!