10-MAS

Multi-agent systems, planning, orchestration

AIM-RM — LLM 多 Agent 库存管理：历史经验相似匹配

10-MAS

LLM-MAS 在库存管理中面临跨场景适应性差的困境——不同 SKU、季节、供应链配置导致需求模式千差万别，零样本或少样本 LLM Agent 难以泛化到新场景。

200-400万元

causalexperimentforecastingoptimizationragmulti_agent广告与投放供应链与补货推荐与搜索MAS与智能体工程

MemGPT — 长期记忆与虚拟上下文管理

10-MAS

MemGPT 将操作系统的虚拟内存管理思想引入 LLM Agent 的记忆系统。核心洞察：LLM 的上下文窗口就像物理 RAM——容量有限且昂贵，而 Agent 需要处理的任务往往远超这个容量。解决方案是构建一个分层记忆体系，让 LLM 主动管理自己的记忆。

⭐⭐⭐⭐☆

causalexperimentragknowledge_graphmulti_agentpricing客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润

Agent Production Engineering（Agent 生产化工程）

10-MAS

连接 MAS 算法层（AutoGen/ReAct/编排）和智能体工程层（MCP/Context/Skill管理），把"能跑的 Agent demo"变成"生产可用的 Agent 系统"。核心模式：算法→协议→基础设施。

⭐⭐⭐⭐☆

optimizationmulti_agent供应链与补货MAS与智能体工程

Agent Q-Mix — MARL 学习最优 MAS 通信拓扑（QMIX 值分解）

10-MAS

Agent Q-Mix 将多 Agent 系统的通信拓扑选择建模为多智能体强化学习（MARL）问题：每个 Agent 在每个时间步从 6 种通信动作中选择一个，整个系统通过 QMIX 值分解联合优化，学习"哪些 Agent 需要相互通信、何时通信、用何种方式通信"。

5-10 万⭐⭐⭐☆☆

causalexperimentoptimizationmulti_agent供应链与补货MAS与智能体工程风控与合规

Agent Registry & Discovery — 动态 Agent 能力注册与路由

10-MAS

静态工具注册（配置文件写死 Agent 列表）无法应对 MAS 三大动态性：① Agent 数量动态扩缩；② 能力随版本演化；③ 健康状态实时变化（宕机/过载/SLO 降级）。

⭐⭐⭐☆☆

causalexperimentforecastingmulti_agentpricing供应链与补货MAS与智能体工程定价与利润风控与合规

AgenticPay — LLM 多 Agent 采购谈判：自主完成价格与 MOQ 协商

10-MAS

AgenticPay 将买卖双方谈判建模为三方博弈：Buyer Agent（代理买家利益）+ Seller Agent（代理卖家利益）+ Mediator Agent（协调双方找到 ZOPA）。LLM 驱动每个 Agent 根据各自的 BATNA（最佳替代方案）和策略参数自主生成报价、评估还价、决定让步幅度。

5 万元⭐⭐☆☆☆

causalexperimentforecastingoptimizationragmulti_agentpricing知识图谱与RAGMAS与智能体工程定价与利润

AutoGen — 多智能体对话编排框架

10-MAS

AutoGen 是一个通用的多智能体对话框架，核心洞察：将复杂的 LLM 应用开发简化为多 agent 之间的对话编排。不同于传统的单 agent 链式调用，AutoGen 允许多个具备不同能力的 agent 通过自然语言对话协作完成复杂任务。

⭐⭐⭐☆☆

causalexperimentoptimizationragmulti_agentpricing供应链与补货客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润

CAMEL — 角色扮演式自主协作多 Agent 框架

10-MAS

CAMEL (Communicative Agents for "Mind" Exploration of Large Language Model Society) 提出了一种基于角色扮演（Role-Playing）的多 Agent 自主协作范式。核心洞察：当两个互补角色的 Agent（指令发出者 vs 执行者）在结构化协议约束下对话时，可以自主完成复杂任务，无需人工逐步干预。

⭐⭐⭐☆☆

causalexperimentrecommendationmulti_agentpricing客服与VOC推荐与搜索MAS与智能体工程定价与利润

Cross-Org Agent Protocol — 跨组织多智能体协调协议：多委托人、联邦编排、工作区委托

10-MAS

MCP（Model Context Protocol）：解决 Agent 与工具/数据源的连接（Host ↔ Server）

⭐⭐⭐⭐☆

causalexperimentoptimizationmulti_agentpricing广告与投放供应链与补货数据采集与治理MAS与智能体工程定价与利润风控与合规

Dynamic DAG Orchestration — 运行时动态调整工作流 DAG

10-MAS

静态 DAG 的局限：传统工作流引擎（Airflow、Prefect 等）要求在运行前确定完整的 DAG 拓扑。一旦启动，节点集合与依赖边均固定，无法根据中间执行结果裁剪冗余分支或插入新必要节点。当业务逻辑含有"发现 A 就不需要 B"或"发现 C 就需要新增 D"的条件语义时，静态 DAG 只能用 stub 节点 + 空操作变通，徒增图复杂度。

⭐⭐⭐☆☆

causalexperimentforecastingoptimizationmulti_agent供应链与补货MAS与智能体工程定价与利润风控与合规

Event-Driven Demand MAS — 事件感知补货 MAS：大促/季节自动触发

10-MAS

传统补货系统是轮询式（定时跑批），每日/每周检查库存状态。事件驱动架构（Event-Driven Architecture）改为推送式：事件发生时立刻触发对应 Agent，实现毫秒级响应而非天级延迟。

5000 万元⭐⭐⭐☆☆

causalexperimentforecastingmulti_agentpricing供应链与补货MAS与智能体工程定价与利润

EvoSC — 对比反思 + 自我巩固：Agent 从失败轨迹进化

10-MAS

EvoSC（Self-Consolidation for Self-Evolving Agents，arXiv 2602.01966，2026年2月）解决了现有 Agent 自我进化框架的两个根本缺陷

⭐⭐⭐☆☆

causalexperimentrecommendationmulti_agent广告与投放客服与VOC推荐与搜索MAS与智能体工程风控与合规

Flowr — 零售供应链多 Agent 端到端自动化

10-MAS

母婴品牌在亚马逊/独立站同时运营，SKU 达 500+，跨境仓（海外仓 + 国内直发）补货涉及 DHL/UPS 运输周期（15-30 天）、海关清关（3-7 天）、Amazon FBA 入仓（1-5 天），任何一环延误都导致断货（Lost Buy Box，单 SKU 日损失 2,000-8,000 元）

91 万元

causalexperimentforecastingoptimizationragmulti_agentpricing供应链与补货客服与VOC知识图谱与RAGMAS与智能体工程定价与利润

G²CP — 图结构 MAS 通信协议：消除级联幻觉

10-MAS

传统 LLM Multi-Agent System（MAS）中，Agent 之间通过自然语言传递信息。

⭐⭐⭐☆☆

causalexperimentforecastingmulti_agentvisual_generation供应链与补货MAS与智能体工程风控与合规视觉内容生成

Helicase — 不确定性感知供应链知识图谱：多 Agent 自主构建

10-MAS

Helicase 是一个自主多 Agent LLM 系统，将高层供应链查询（如"某奶粉品牌的原料来源"）分解为可执行调查计划，通过专业 Agent 协作增量构建带不确定性标注的知识图谱。名字来源于生物学的螺旋酶——螺旋式展开 DNA，隐喻系统通过迭代循环逐层揭示知识。

⭐⭐⭐☆☆

causalexperimentragknowledge_graphmulti_agent供应链与补货推荐与搜索知识图谱与RAGMAS与智能体工程风控与合规

LLM AutoBidding MAS — 大语言模型驱动的层次化自动竞价系统

10-MAS

诊断：用单一 LLM 直接生成竞价出价，会产生"竞价幻觉"——LLM 对价格的量化感知不准确，输出如 `$15.00`（实际均值 $0.80）的离谱出价。

⭐⭐⭐☆☆

causalexperimentoptimizationrecommendationragmulti_agentpricing广告与投放推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润

MAS Adversarial Defense — 多智能体系统攻防：群体合谋检测、规划时攻击防御、路由感知注入

10-MAS

`Skill-Agent-Safety-Guardrails` 保护的是单个 Agent 免受提示注入攻击。但 MAS 中的攻击比单 Agent 复杂 10 倍：攻击者可以利用多个 Agent 之间的信任关系和通信路径发动群体级攻击。

5-10 万/月⭐⭐⭐☆☆

causalexperimentoptimizationmulti_agentpricing广告与投放供应链与补货推荐与搜索MAS与智能体工程定价与利润

MAS Consensus Mechanism — 多智能体共识协议：分布式一致性与拜占庭容错

10-MAS

`Skill-Multi-Agent-Debate` 解决的是"如何让多个 Agent 通过辩论收敛到更好的答案"——这是非正式共识。MAS 共识机制解决的是更严格的问题：在部分 Agent 可能失败或说谎（Byzantine 容错）的情况下，如何保证整个系统仍能达成一致且正确的决策，并有数学证明？

200-500 万⭐⭐☆☆☆

causalexperimentmulti_agent广告与投放供应链与补货MAS与智能体工程风控与合规

MAS Dynamic KG Collaboration — 多智能体动态知识图谱协同：实时构建、冲突解决、协同进化

10-MAS

`Skill-Helicase-Supply-Chain-KG-MAS` 解决的是"如何让 MAS 构建一个静态知识图谱"——一次性构建，然后查询。动态 KG 协同解决的是更难的问题：知识在持续演变，多个 Agent 同时读写 KG，如何保持 KG 的一致性、处理冲突、并让 KG 与 Agent 共同进化？

⭐⭐⭐☆☆

causalexperimentragknowledge_graphmulti_agentfraud_detectionpricing广告与投放知识图谱与RAGMAS与智能体工程定价与利润风控与合规

MAS Dynamic Trust — 多智能体动态信任图：抵御 Sleeper Agent 与历史感知可信聚合

10-MAS

MAS 中 Agent 之间传递消息，但消息的可信度并不相同——某个 Agent 可能已被攻击者控制（Sleeper Agent），在积累足够信任后才触发恶意行为。动态信任管理解决的问题是：在没有可信第三方的情况下，每个 Agent 如何评估其他 Agent 发来消息的可信度，并据此决定接受或拒绝。

5-30 万元⭐⭐☆☆☆

experimentforecastingmulti_agentpricing供应链与补货推荐与搜索MAS与智能体工程定价与利润风控与合规

MAS Orchestrator — 多智能体编排与调度

10-MAS

MAS Orchestrator 是多 Agent 系统的"中枢神经系统"，负责协调多个子 Agent 的执行顺序、数据流转、状态同步和错误恢复。核心洞察：分解后的子任务需要一个可靠的调度器来管理它们的生命周期——启动、监控、通信、容错、收尾。

⭐⭐⭐⭐☆

experimentoptimizationknowledge_graphmulti_agentvisual_generation客服与VOC知识图谱与RAGMAS与智能体工程视觉内容生成

MAS Resource Scheduling — OS 调度原语驱动的多智能体资源管理

10-MAS

MAS 生产化最常见的失败不来自 Agent 逻辑，而来自资源竞争：多个 Agent 并行调用同一个限速 API，导致连接重置、HTTP 502、上下文泄漏、Zombie Agent 挂起。这些问题在操作系统领域早已有成熟解法——HiveMind 和 AgentRM 把 OS 调度理论直接搬到 MAS 层。

12 万元⭐⭐☆☆☆

causalexperimentforecastingoptimizationknowledge_graphmulti_agentpricing供应链与补货知识图谱与RAGMAS与智能体工程定价与利润风控与合规

MAS Scale Management — 大规模多智能体集群管理：万级并发、单调扩展、公司制架构

10-MAS

1. 性能坍塌问题：新 Agent 加入时，系统路由还不了解其能力，导致任务分配混乱、性能下降

⭐⭐⭐☆☆

experimentoptimizationmulti_agent广告与投放供应链与补货客服与VOCMAS与智能体工程风控与合规

MAS Testing & Verification — 多智能体系统测试验证：覆盖制导 Fuzzing + 跨框架可观测性

10-MAS

MAS 的失败模式与单体软件完全不同：Agent 之间的交互是非确定性的，工具调用可能失败，Agent 可能陷入死循环，而这些问题用传统单元测试根本无法发现。MAS 专用测试体系需要解决三个独特问题

causalexperimentragmulti_agent广告与投放供应链与补货客服与VOC知识图谱与RAGMAS与智能体工程风控与合规

MASEval — 系统级 MAS 评估：Framework 影响与模型影响同等重要

10-MAS

传统 MAS 评估聚焦模型级（Model-Level）：固定 framework，换 LLM 比性能差异。MASEval 提出系统级（System-Level）评估范式，将完整 MAS 系统（模型 × Framework × 协调逻辑）作为原子评测单元，形成 3×3×3 全因子实验设计：3 个 LLM backbone × 3 个 Agent Framework（smolagents/LlamaIndex/AutoGen 等）× 3 种协调逻辑（顺序/并行/自适应）。

20-60 万⭐⭐☆☆☆

causalexperimentoptimizationrecommendationmulti_agent供应链与补货推荐与搜索MAS与智能体工程

MetaGPT — SOP 驱动的多智能体协作框架

10-MAS

MetaGPT 将人类组织中的 Standardized Operating Procedures（SOP，标准作业程序）引入多 agent 协作。核心洞察：复杂任务失败的主要原因是 agent 间缺乏标准化协作规范和结构化信息传递。通过模拟软件公司的角色分工（PM → Architect → Engineer → QA）和文档驱动的工作流，MetaGPT 显著减少了多 agent 协作中的幻觉和级联错误。

⭐⭐⭐⭐☆

causalexperimentragmulti_agentdata_collectionpricing客服与VOC知识图谱与RAG数据采集与治理MAS与智能体工程定价与利润

Multi-Agent Debate — 多智能体辩论共识

10-MAS

- LLM 生成初始答案后，即使答案错误，也会在后续反思中"维护"这个答案

⭐⭐⭐☆☆

causalexperimentoptimizationrecommendationragmulti_agentpricing客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润

ParaManager — 小模型主编排：Agent-as-Tool 并行子任务分解

10-MAS

Agent-as-Tool 协议统一：ParaManager 将传统系统中异构的 Agent（具有内部状态、多轮推理能力）和 Tool（无状态函数调用）统一为标准化的 `AgentAsTool` 接口。每个动作单元暴露相同的 `invoke(input) -> result` 接口，同时携带显式状态反馈（`status`, `progress`, `output`），让编排器无需了解底层实现差异即可统一调度。

⭐⭐☆☆☆

causalexperimentforecastingoptimizationknowledge_graphmulti_agentpricingvisual_generation广告与投放供应链与补货推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润风控与合规视觉内容生成

ReAct — 推理与行动交替执行

10-MAS

ReAct (Reasoning + Acting) 提出了一种推理与行动交织的范式。核心洞察：纯推理（Chain-of-Thought）容易幻觉，纯行动（Tool Use）缺乏规划——只有把两者交替进行，才能既保持思维连贯性又确保信息准确性。

⭐⭐⭐☆☆

causalexperimentmulti_agentpricing广告与投放客服与VOC推荐与搜索MAS与智能体工程定价与利润

Reflexion — 言语强化学习与自我反思

10-MAS

Reflexion 提出了一种言语强化学习（Verbal Reinforcement Learning）机制。核心洞察：传统 RL 需要更新模型权重，成本高且难以解释；而 LLM 可以通过自然语言形式的"自我反思"来改进策略，无需任何权重更新。

⭐⭐⭐⭐☆

causalexperimentoptimizationmulti_agentpricing供应链与补货客服与VOCMAS与智能体工程定价与利润

SDOF — 状态机约束 MAS 编排：屏蔽非法操作，任务完成率 86.5%

10-MAS

SDOF 将 Multi-Agent System（MAS）的执行流程建模为有限状态机（FSM），通过双层防护机制确保 Agent 行为的合法性。

⭐⭐⭐☆☆

causalexperimentforecastingoptimizationmulti_agent广告与投放供应链与补货MAS与智能体工程风控与合规

Self-Refine + RL — 反馈闭环与自进化 Agent

10-MAS

Self-Refine 是一种让 Agent 对自身输出进行批评和改进的迭代机制。核心洞察：语言模型不仅能生成内容，也能评估和改进内容——利用同一模型的双重能力，实现无需外部监督的自我进化。

⭐⭐⭐⭐☆

causalexperimentoptimizationmulti_agent客服与VOC数据采集与治理MAS与智能体工程

Skill Registry — 技能注册表与动态发现

10-MAS

Skill Registry 是 MAS 工作流的核心基础设施，负责管理所有可用技能的元数据、依赖关系和运行时状态。核心洞察：一个可扩展的多 Agent 系统必须能动态发现、加载和组合技能，而不是硬编码固定流程。

⭐⭐⭐☆☆

experimentmulti_agent客服与VOC数据采集与治理MAS与智能体工程

Subagent Decomposer — 复杂任务子智能体分解

10-MAS

Subagent Decomposer 负责将复杂的 Task Blueprint 分解为可独立执行的子任务，并分配给专门的子 Agent。核心洞察：复杂任务（如"生成全品类 VOC 周报"）无法由单个 Agent 高效完成，必须分解为并行/串行的子任务，每个子任务由最优技能的子 Agent 执行。

36万⭐⭐⭐⭐☆

experimentrecommendationmulti_agentpricing客服与VOC推荐与搜索MAS与智能体工程定价与利润

Tree of Thoughts — 树搜索式任务规划

10-MAS

Tree of Thoughts (ToT) 将 LLM 的推理过程从线性链式思维（Chain-of-Thought）扩展为树状搜索。核心洞察：人类解决复杂问题时会探索多条路径、评估中间进展、在死胡同回溯——LLM 也应该具备这种"深思熟虑"的能力。

⭐⭐⭐⭐☆

causalexperimentoptimizationrecommendationmulti_agentpricing客服与VOC推荐与搜索MAS与智能体工程定价与利润