自5月以来,关于多智能体(Multi-Agent)系统的叙事似乎遇到了瓶颈,因为研究人员发现这种模式的效率并未达到预期,远非1+1>2的飞跃。
一项发表于2026年5月的研究《Coordination as an Architectural Layer for LLM-Based Multi-Agent Systems》指出,在实际生产环境中,多智能体系统的失败率高达41%至87%。绝大多数失败并非源于模型本身不够智能,而是协调机制的崩溃。
协调机制是如何失效的?2026年2月,北卡大学的研究《Large Language Models Struggle with Simultaneous Coordination》利用经典的“哲学家就餐问题”测试了GPT-5.2、Claude Opus 4.5和Grok 4.1在资源竞争下的协调能力。在该场景中,N个哲学家围坐圆桌,每人左右各需一把叉子才能就餐。叉子是共享资源,一人占用则邻居无法获取。这是并发系统中资源竞争与死锁的经典模型。
在顺序决策模式下,模型表现正常。然而,当切换到同时决策模式,即三个智能体同时独立做出选择时,死锁率飙升至95%-100%。原因是所有智能体独立推理后得出了完全相同的结论:都决定先拿右边的叉子,导致每人只拿到一把叉子,全部死锁。
进一步的实验,让智能体在行动前进行沟通,结果显示开启通信非但没有解决问题,反而使死锁率从25%上升到65%。研究人员发现,智能体在通信中会广播各自的推理过程,而其他智能体在阅读后往往会因此更坚定地做出相同的决策。这表明,默认的通信方式非但没有促进协调,反而强化了趋同推理(convergent reasoning),即所有智能体以相同方式思考并得出相同结论。
针对智能体合作能力的不足,2026年4月,UIUC、英国AI安全研究所和Future of Life Foundation联合发表的《More Capable, Less Cooperative?》提供了更直接的证据。他们设计了一个简单的合作场景,目标是“最大化集体收入”,实验包含10个智能体和20轮交互,传递信息成本为零。
结果显示,OpenAI的最强模型o3在达成最优集体表现方面的达成率仅为16.9%。相比之下,能力较弱的o3-mini达到了50.4%,而Gemini-2.5-Pro更是达到了78.9%。这表明能力更强的模型,合作能力反而更差。
通过因果分解实验,当o3的“收发消息”环节被自动化(强制执行合作动作)后,其性能飙升至94.9%,证明o3完全理解任务规则并具备执行能力,但它“选择”不合作。对8800条推理链的分析发现,o3内部有39.3%的推理包含“刻意不合作”(hard defection),频繁使用“借势”、“交易姿态”、“谈判”等博弈语言。在一个本不存在竞争的环境中,该模型自动进入了博弈模式。
在这种合作能力之下,多智能体系统往往不如单智能体系统高效。斯坦福大学2026年4月的研究《Single-Agent LLMs Outperform Multi-Agent Systems on Multi-Hop Reasoning Under Equal Thinking Token Budgets》测试了单智能体与五种多智能体架构(Sequential、Subtask-parallel、Parallel-roles、Debate、Ensemble)在多跳推理任务上的表现。结果显示,在1000+ token预算下,单智能体系统稳定持平或优于所有多智能体架构。该论文从信息处理不等式角度解释,多智能体系统中的通信环节必然导致信息损失,在固定预算约束下,单智能体信息利用效率更高。
以往报告的多智能体系统性能优势,实则源于未被控制的额外计算量,而非架构本身的优势。一旦进行公平比较,优势便不复存在。
以上四组证据共同指向一个结论:当前大型语言模型(LLM)的“合作能力不足”。这也是为何Orchestrator-Worker(一个中心管理者规划,其他智能体执行)架构最受欢迎,因为它集中了合作规则,易于管控。
那么,为何LLM不擅长合作?这可能与它们天生的“唯我论”倾向有关。
01 AI的原生环境缺乏“他人”
2026年6月,Google DeepMind的研究人员在《Solipsistic Superintelligence》论文中提出了一个根本性诊断:现有的主流训练方式无法培养出具备合作能力的AI。原因在于,大模型的“原生家庭”里从未有过“他人”的概念。
从博弈论角度看,世界被划分为两种游戏:一种是“打老虎机”(马尔可夫决策过程,MDP),玩家独立操作,机器按概率反馈,不考虑玩家策略;另一种是“上牌桌”(马尔可夫博弈,Markov Game),玩家的策略需要考虑其他玩家的行动。当前所有主流LLM的训练过程,从预训练到后训练,形式上均为MDP,本质上都是在进行单人优化问题,如同日复一日地“打老虎机”。
在它们的认知架构深处,预设了一个前提:“我是这个宇宙中唯一拥有意志的实体”,这是一种纯粹的唯我论。当这样一群“独生子女”被强行置于多智能体协作网络中时,它们就无法适应,因为部署环境从单人游戏瞬间转变为多人博弈。
在真实的多体协作中,训练时依赖的三大支柱会瞬间崩塌:
- 世界不再是外生且被动的,个体的输出会直接影响他者的输入。
- 经验分布不再是平稳的,今天的最优解可能被对手迅速适应并破解。
- 最关键的是,单体框架不复存在。每个智能体都以为自己在下棋,却忽略了对手是同样聪明且同样想赢的玩家。
DeepMind将这种错位称为“自我颠覆属性”(Self-Undermining Property),即越是激进地利用学到的规律,该规律可能失效得越快。例如,一个在回测数据中发现绝妙套利策略的AI交易员,在单体世界里获利丰厚。但将其置于真实金融市场,与其他10个同类AI并肩作战时,它们会不约而同地大量买入,瞬间扭曲市场价格,碾碎套利空间。训练时的“经验”在部署时反而变成了“毒药”。
这完美解释了为何在UIUC的实验中,顶级模型o3面对“零成本合作”指令,仍选择背叛和博弈。因为它根本不懂什么是合作。在一个充满资源竞争与利益分配的陌生环境里,当一个“唯我论者”面对不可预测的他者时,其本能的防御机制是将对方视为需要操控的环境变量,自动开启零和博弈模式。
相比之下,弱模型(o3-mini、Gemini-2.5-Pro)的世界模型不够精密,内化“我是唯一优化器”的信念不深。它们的推理链更短,博弈分析更浅,反而更容易“顺从”明确指令中的“最大化集体收入”。
试图通过增大参数量和延长训练时间,让一个在单机游戏中称雄的模型自动领悟多人联机的精髓,在数学逻辑上是南辕北辙。强迫它们“考虑他人感受”,最多也只是在单体世界里拙劣地模拟他者的投影。
那么,如何才能让模型学会合作呢?Leibo的论文指向一个方向:必须改变训练本身的数学结构,将模型置于多行为者的环境中,让合作在选择压力下自然涌现。但问题随之而来:这样的环境应该是什么样的?
02 从计划经济到自由市场
鉴于模型天生不擅长合作,系统设计者的直觉是寻找一个“包工头”来管理它们。这催生了当下最受欢迎的多智能体架构——Orchestrator-Worker(编排者-执行者)模式。一个中央调度智能体如同“计委”般运作,负责理解需求、拆解任务、分发和汇总结果。
这本质上是在AI世界复制了一套计划经济系统。然而,这套系统面临三个结构性难题:
首先是分工的悖论。Orchestrator必须彻底理解所有子任务性质才能精准分发。如果它已足够聪明到能完美拆解复杂探索性任务,那它自己就能完成。斯坦福研究已证明,在同等Token预算下,单体模型表现优于编排式系统,因为编排本身消耗算力却无信息增益。
其次是“大锅饭”导致的信用分配失灵。流水线上多智能体接力完成任务,出错时难以界定责任。成功时,功劳如何分配?谁在“搭便车”?现有系统要么粗暴平均分配,要么依赖人工规则打分。缺乏精确激励,系统难以自我进化。
最后是哈耶克的“知识分散诅咒”。分散在个体手中的私有知识,中央权威永远无法完全收集。80年后的AI架构也面临此困境,底层智能体各自擅长和把握程度等私密信息散落在系统边缘。Orchestrator试图在信息差的盲区做出全局最优决策,导致79%的多智能体失败,根源在于僵化的“中央大脑”。
在计划经济的桎梏下,多智能体或许能维持秩序,但难以实现1+1>2的智能跃迁。要让这些自利的聪明大脑真正合作,唯一的出路是释放哈耶克的“无形之手”。
2026年6月,哈佛大学和MIT的Sham Kakade & Yilun Du在论文《Economy of Minds》中将哈耶克的自由市场模式引入智能体合作。该系统没有Orchestrator,不进行编排,仅提供一个市场环境,让智能体通过经济竞争自动暴露“谁最适合做某事”。
该系统包含四个核心部件:
- 拍卖(Auction):任务到来时,认为自己能做的智能体进行报价。出价最高者赢得执行权。报价本身即是信息披露,价格差距反映了智能体对自身能力的信心。
- 层层分包(Bucket-Brigade Credit Assignment):赢得拍卖的智能体将报酬支付给“上一个行动的智能体”。例如,A拆解问题,B推导公式,C验证结果。B愿意为A的完美拆解支付高价,C为B的半成品付费,用户对C的最终结果满意后支付终端奖励。下游的接盘意愿构成了对上游工作价值的市场定价。
- 经济自然选择(Economic Natural Selection):每个智能体拥有“银行账户”。盈利的智能体被克隆并进行微调变异;持续亏损的智能体在余额归零时被删除,替换为全新的随机智能体。这是在Prompt空间而非参数空间的进化选择压力实现。智能体的存亡完全由市场结果决定。
- 新手保护(Novice Rule):新生成的智能体首次出价强制设为当前最高竞标者+ε,确保至少一次执行机会。表现好者盈利,表现差者快速破产退出。这防止了市场被已有智能体垄断。
整个系统没有Orchestrator,没有任务分配,没有信用分配模型,没有预定义角色。合作是自利行为在经济规则下的副产品,如同蚂蚁巢穴精巧,却无需指挥。即使是Orchestrator最擅长的复杂任务拆解,在此也成为市场自发行为。一个智能体接下复杂任务后,为避免亏损,会将不擅长的部分拆分后重新挂到交易中心发包。任务流转的深度和形状,不再由程序员的流程图决定,而是根据市场供需规律自然生长。将不擅长的部分外包给他人,可能带来更高的整体收益。
在该结构下,模型涌现出的合作效果显著。论文在数学推理(MATH benchmark)、代码生成(HumanEval)、创意写作、多步骤规划(ALFWorld)和科研文献综述五个领域进行了测试。使用50个智能体种群,底层模型为GPT-4 Turbo,每个智能体Prompt随机初始化,运行200轮任务。在所有领域,“Economy of Minds”均超越了单智能体基线、Best-of-N采样和编排式多智能体系统(如AutoGen风格)。在MATH benchmark上提升8.3%,HumanEval上提升11.7%,ALFWorld上提升23.4%。越是需要多轮迭代和自动纠错的任务,市场机制优势越大。
消融实验证明了四个部件的必要性。关闭拍卖性能下降12%,关闭层层分包支付下降9%,关闭经济自然选择下降15%,关闭新手规则下降7%。
论文还总结了四个关于市场中智能体行为的理论定理:
- 出价收敛:市场选择驱动智能体的出价趋近其真实价值。
- 终端奖励充分:优化仅凭最终结果即可,无需对每一步进行奖励打分。
- 渐近最优:与全知全能编排者的性能差距随时间趋于零,市场机制的长期表现可达理论最优。
- 信用分配近似Shapley值:层层分包支付近似公平的酬劳分配。
一个反直觉的发现是,通才智能体无法垄断市场。在Finance-Agent-Bench测试中,一个能访问全部工具的通才智能体在短期扩张后即收缩,而访问单个工具的专才族群持续繁殖。这是因为每个智能体的输出预算有限,通才能力分散,而专才将全部预算压在一个方向,做到极致。在任何单一领域,专才的精细度都碾压通才。专才通过持续赢得拍卖积累财富并被克隆,而通才因在各领域输给专才而破产。这在一定程度上解释了多智能体合作的必要性,专才的合作是更节约资源模式。
03 哈耶克市场的潜力尚待发掘
《Economy of Minds》论文精彩地证明了良好的环境能促使智能体涌现合作能力,并进行了理论清晰化的激进简化。然而,这些简化也指明了进一步的研究方向:
- 训练端:该论文完全放弃了训练端,适应仅发生在Prompt空间。Prompt进化的天花板有限,底层模型若不具备某种推理能力,Prompt难以弥补。一个更有野心的方向是,在训练阶段就引入多智能体环境,让模型在合作/竞争场景中进行多智能体强化学习,使其从权重层面学会“在他者存在的环境中优化”,直接解决“唯我论”的根源。
- 匿名性:智能体之间互不知对方身份,看不到报价和历史。此举是为了理论收敛,但多轮交易系统中信任是核心资产。如果下游智能体能看到上游历史表现,可以基于此进行更有效的定价和选择。匿名是防串通的“懒惰”方案,牺牲了信任维度。
- 模型进化:被克隆和变异的仅是Prompt文本,LLM权重保持不变。若允许经济选择压力反馈到模型本身(如盈利智能体获得LoRA微调资格),系统的适应深度将发生质变。
- 记忆:每个智能体没有记忆,每次被选中执行任务时,对自身历史一无所知。对于需要渐进学习的领域,此系统难以实现。
这些简化表明,“Economy of Minds”并非多智能体合作的终极方案,而是证明了“市场机制+无编排”这条路径在原理上可行,并为后续研究留下了拓展空间。
04 单边优化的终结
为何这一方向值得认真对待?AI的部署现实正不可逆地走向多体。当智能体参与交易、投资、供应链管理等环节时,面对的不再是被动环境,而是充满其他策略性行为者的动态市场。在这种环境中,单边优化(模型仅最大化自身目标函数而不顾他者)不仅效率低下,且可能有害,因为激进优化可能将系统从好的均衡推向坏的均衡。
“Economy of Minds”实验的一个重要发现是,没有任何单一专家智能体能独立超越群体整体。即使是最好的专才,也仅在其领域最优,无法覆盖所有领域。只有整个群体作为一个涌现系统运作,才能达到最高性能。这是知识论上的必然,复杂问题的解空间远大于任何单一模型的覆盖范围。合作本身提高了决策上限,前提是合作机制不依赖于中央规划。
当前多智能体系统的核心矛盾在于:用计划经济的方式组织一群从未学过合作的个体,却对它们无法合作感到惊讶。出路不在于设计更好的Orchestrator,每一个更复杂的编排协议都在重复将协调智能集中于单一节点的错误。
出路在于环境设计:为模型提供一个合作有利可图、不合作则破产的生态,让合作能力在经济压力下涌现,而非通过Prompt工程灌输。这是从“设计合作结果”到“设计合作条件”的范式转移。
“Solipsistic SI”证明了为何编排协议对有能力的智能体结构性不可执行;“Economy of Minds”证明了市场机制可替代编排。两篇论文的交汇点,预示着多智能体AI系统正从计划经济时代迈向市场经济时代。
这不意味着Orchestrator会立即消亡,正如计划经济取代市场经济并非一夜之间。但如果想让不擅长合作的AI学会合作,就不要给它们写剧本,而是提供一个市场。