paper2skills Playbook

10-MAS

Multi-agent systems, planning, orchestration

AIM-RM — LLM 多 Agent 库存管理:历史经验相似匹配

10-MAS

LLM-MAS 在库存管理中面临跨场景适应性差的困境——不同 SKU、季节、供应链配置导致需求模式千差万别,零样本或少样本 LLM Agent 难以泛化到新场景。

200-400万元
causalexperimentforecastingoptimizationragmulti_agent广告与投放供应链与补货推荐与搜索MAS与智能体工程

MemGPT — 长期记忆与虚拟上下文管理

10-MAS

MemGPT 将操作系统的虚拟内存管理思想引入 LLM Agent 的记忆系统。核心洞察:LLM 的上下文窗口就像物理 RAM——容量有限且昂贵,而 Agent 需要处理的任务往往远超这个容量。解决方案是构建一个分层记忆体系,让 LLM 主动管理自己的记忆。

⭐⭐⭐⭐☆
causalexperimentragknowledge_graphmulti_agentpricing客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润

Agent Production Engineering(Agent 生产化工程)

10-MAS

连接 MAS 算法层(AutoGen/ReAct/编排)和智能体工程层(MCP/Context/Skill管理),把"能跑的 Agent demo"变成"生产可用的 Agent 系统"。核心模式:算法→协议→基础设施。

⭐⭐⭐⭐☆
optimizationmulti_agent供应链与补货MAS与智能体工程

Agent Q-Mix — MARL 学习最优 MAS 通信拓扑(QMIX 值分解)

10-MAS

Agent Q-Mix 将多 Agent 系统的通信拓扑选择建模为多智能体强化学习(MARL)问题:每个 Agent 在每个时间步从 6 种通信动作中选择一个,整个系统通过 QMIX 值分解联合优化,学习"哪些 Agent 需要相互通信、何时通信、用何种方式通信"。

5-10 万⭐⭐⭐☆☆
causalexperimentoptimizationmulti_agent供应链与补货MAS与智能体工程风控与合规

Agent Registry & Discovery — 动态 Agent 能力注册与路由

10-MAS

静态工具注册(配置文件写死 Agent 列表)无法应对 MAS 三大动态性:① Agent 数量动态扩缩;② 能力随版本演化;③ 健康状态实时变化(宕机/过载/SLO 降级)。

⭐⭐⭐☆☆
causalexperimentforecastingmulti_agentpricing供应链与补货MAS与智能体工程定价与利润风控与合规

AgenticPay — LLM 多 Agent 采购谈判:自主完成价格与 MOQ 协商

10-MAS

AgenticPay 将买卖双方谈判建模为三方博弈:Buyer Agent(代理买家利益)+ Seller Agent(代理卖家利益)+ Mediator Agent(协调双方找到 ZOPA)。LLM 驱动每个 Agent 根据各自的 BATNA(最佳替代方案)和策略参数自主生成报价、评估还价、决定让步幅度。

5 万元⭐⭐☆☆☆
causalexperimentforecastingoptimizationragmulti_agentpricing知识图谱与RAGMAS与智能体工程定价与利润

AutoGen — 多智能体对话编排框架

10-MAS

AutoGen 是一个通用的多智能体对话框架,核心洞察:将复杂的 LLM 应用开发简化为多 agent 之间的对话编排。不同于传统的单 agent 链式调用,AutoGen 允许多个具备不同能力的 agent 通过自然语言对话协作完成复杂任务。

⭐⭐⭐☆☆
causalexperimentoptimizationragmulti_agentpricing供应链与补货客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润

CAMEL — 角色扮演式自主协作多 Agent 框架

10-MAS

CAMEL (Communicative Agents for "Mind" Exploration of Large Language Model Society) 提出了一种基于角色扮演(Role-Playing)的多 Agent 自主协作范式。核心洞察:当两个互补角色的 Agent(指令发出者 vs 执行者)在结构化协议约束下对话时,可以自主完成复杂任务,无需人工逐步干预。

⭐⭐⭐☆☆
causalexperimentrecommendationmulti_agentpricing客服与VOC推荐与搜索MAS与智能体工程定价与利润

Dynamic DAG Orchestration — 运行时动态调整工作流 DAG

10-MAS

静态 DAG 的局限:传统工作流引擎(Airflow、Prefect 等)要求在运行前确定完整的 DAG 拓扑。一旦启动,节点集合与依赖边均固定,无法根据中间执行结果裁剪冗余分支或插入新必要节点。当业务逻辑含有"发现 A 就不需要 B"或"发现 C 就需要新增 D"的条件语义时,静态 DAG 只能用 stub 节点 + 空操作变通,徒增图复杂度。

⭐⭐⭐☆☆
causalexperimentforecastingoptimizationmulti_agent供应链与补货MAS与智能体工程定价与利润风控与合规

Event-Driven Demand MAS — 事件感知补货 MAS:大促/季节自动触发

10-MAS

传统补货系统是轮询式(定时跑批),每日/每周检查库存状态。事件驱动架构(Event-Driven Architecture)改为推送式:事件发生时立刻触发对应 Agent,实现毫秒级响应而非天级延迟。

5000 万元⭐⭐⭐☆☆
causalexperimentforecastingmulti_agentpricing供应链与补货MAS与智能体工程定价与利润

EvoSC — 对比反思 + 自我巩固:Agent 从失败轨迹进化

10-MAS

EvoSC(Self-Consolidation for Self-Evolving Agents,arXiv 2602.01966,2026年2月)解决了现有 Agent 自我进化框架的两个根本缺陷

⭐⭐⭐☆☆
causalexperimentrecommendationmulti_agent广告与投放客服与VOC推荐与搜索MAS与智能体工程风控与合规

Flowr — 零售供应链多 Agent 端到端自动化

10-MAS

母婴品牌在亚马逊/独立站同时运营,SKU 达 500+,跨境仓(海外仓 + 国内直发)补货涉及 DHL/UPS 运输周期(15-30 天)、海关清关(3-7 天)、Amazon FBA 入仓(1-5 天),任何一环延误都导致断货(Lost Buy Box,单 SKU 日损失 2,000-8,000 元)

91 万元
causalexperimentforecastingoptimizationragmulti_agentpricing供应链与补货客服与VOC知识图谱与RAGMAS与智能体工程定价与利润

G²CP — 图结构 MAS 通信协议:消除级联幻觉

10-MAS

传统 LLM Multi-Agent System(MAS)中,Agent 之间通过自然语言传递信息。

⭐⭐⭐☆☆
causalexperimentforecastingmulti_agentvisual_generation供应链与补货MAS与智能体工程风控与合规视觉内容生成

Helicase — 不确定性感知供应链知识图谱:多 Agent 自主构建

10-MAS

Helicase 是一个自主多 Agent LLM 系统,将高层供应链查询(如"某奶粉品牌的原料来源")分解为可执行调查计划,通过专业 Agent 协作增量构建带不确定性标注的知识图谱。名字来源于生物学的螺旋酶——螺旋式展开 DNA,隐喻系统通过迭代循环逐层揭示知识。

⭐⭐⭐☆☆
causalexperimentragknowledge_graphmulti_agent供应链与补货推荐与搜索知识图谱与RAGMAS与智能体工程风控与合规

LLM AutoBidding MAS — 大语言模型驱动的层次化自动竞价系统

10-MAS

诊断:用单一 LLM 直接生成竞价出价,会产生"竞价幻觉"——LLM 对价格的量化感知不准确,输出如 `$15.00`(实际均值 $0.80)的离谱出价。

⭐⭐⭐☆☆
causalexperimentoptimizationrecommendationragmulti_agentpricing广告与投放推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润

MAS Adversarial Defense — 多智能体系统攻防:群体合谋检测、规划时攻击防御、路由感知注入

10-MAS

`Skill-Agent-Safety-Guardrails` 保护的是单个 Agent 免受提示注入攻击。但 MAS 中的攻击比单 Agent 复杂 10 倍:攻击者可以利用多个 Agent 之间的信任关系和通信路径发动群体级攻击。

5-10 万/月⭐⭐⭐☆☆
causalexperimentoptimizationmulti_agentpricing广告与投放供应链与补货推荐与搜索MAS与智能体工程定价与利润

MAS Consensus Mechanism — 多智能体共识协议:分布式一致性与拜占庭容错

10-MAS

`Skill-Multi-Agent-Debate` 解决的是"如何让多个 Agent 通过辩论收敛到更好的答案"——这是非正式共识。MAS 共识机制解决的是更严格的问题:在部分 Agent 可能失败或说谎(Byzantine 容错)的情况下,如何保证整个系统仍能达成一致且正确的决策,并有数学证明?

200-500 万⭐⭐☆☆☆
causalexperimentmulti_agent广告与投放供应链与补货MAS与智能体工程风控与合规

MAS Dynamic KG Collaboration — 多智能体动态知识图谱协同:实时构建、冲突解决、协同进化

10-MAS

`Skill-Helicase-Supply-Chain-KG-MAS` 解决的是"如何让 MAS 构建一个静态知识图谱"——一次性构建,然后查询。动态 KG 协同解决的是更难的问题:知识在持续演变,多个 Agent 同时读写 KG,如何保持 KG 的一致性、处理冲突、并让 KG 与 Agent 共同进化?

⭐⭐⭐☆☆
causalexperimentragknowledge_graphmulti_agentfraud_detectionpricing广告与投放知识图谱与RAGMAS与智能体工程定价与利润风控与合规

MAS Dynamic Trust — 多智能体动态信任图:抵御 Sleeper Agent 与历史感知可信聚合

10-MAS

MAS 中 Agent 之间传递消息,但消息的可信度并不相同——某个 Agent 可能已被攻击者控制(Sleeper Agent),在积累足够信任后才触发恶意行为。动态信任管理解决的问题是:在没有可信第三方的情况下,每个 Agent 如何评估其他 Agent 发来消息的可信度,并据此决定接受或拒绝。

5-30 万元⭐⭐☆☆☆
experimentforecastingmulti_agentpricing供应链与补货推荐与搜索MAS与智能体工程定价与利润风控与合规

MAS Orchestrator — 多智能体编排与调度

10-MAS

MAS Orchestrator 是多 Agent 系统的"中枢神经系统",负责协调多个子 Agent 的执行顺序、数据流转、状态同步和错误恢复。核心洞察:分解后的子任务需要一个可靠的调度器来管理它们的生命周期——启动、监控、通信、容错、收尾。

⭐⭐⭐⭐☆
experimentoptimizationknowledge_graphmulti_agentvisual_generation客服与VOC知识图谱与RAGMAS与智能体工程视觉内容生成

MAS Resource Scheduling — OS 调度原语驱动的多智能体资源管理

10-MAS

MAS 生产化最常见的失败不来自 Agent 逻辑,而来自资源竞争:多个 Agent 并行调用同一个限速 API,导致连接重置、HTTP 502、上下文泄漏、Zombie Agent 挂起。这些问题在操作系统领域早已有成熟解法——HiveMind 和 AgentRM 把 OS 调度理论直接搬到 MAS 层。

12 万元⭐⭐☆☆☆
causalexperimentforecastingoptimizationknowledge_graphmulti_agentpricing供应链与补货知识图谱与RAGMAS与智能体工程定价与利润风控与合规

MAS Testing & Verification — 多智能体系统测试验证:覆盖制导 Fuzzing + 跨框架可观测性

10-MAS

MAS 的失败模式与单体软件完全不同:Agent 之间的交互是非确定性的,工具调用可能失败,Agent 可能陷入死循环,而这些问题用传统单元测试根本无法发现。MAS 专用测试体系需要解决三个独特问题

causalexperimentragmulti_agent广告与投放供应链与补货客服与VOC知识图谱与RAGMAS与智能体工程风控与合规

MASEval — 系统级 MAS 评估:Framework 影响与模型影响同等重要

10-MAS

传统 MAS 评估聚焦模型级(Model-Level):固定 framework,换 LLM 比性能差异。MASEval 提出系统级(System-Level)评估范式,将完整 MAS 系统(模型 × Framework × 协调逻辑)作为原子评测单元,形成 3×3×3 全因子实验设计:3 个 LLM backbone × 3 个 Agent Framework(smolagents/LlamaIndex/AutoGen 等)× 3 种协调逻辑(顺序/并行/自适应)。

20-60 万⭐⭐☆☆☆
causalexperimentoptimizationrecommendationmulti_agent供应链与补货推荐与搜索MAS与智能体工程

MetaGPT — SOP 驱动的多智能体协作框架

10-MAS

MetaGPT 将人类组织中的 Standardized Operating Procedures(SOP,标准作业程序) 引入多 agent 协作。核心洞察:复杂任务失败的主要原因是 agent 间缺乏标准化协作规范和结构化信息传递。通过模拟软件公司的角色分工(PM → Architect → Engineer → QA)和文档驱动的工作流,MetaGPT 显著减少了多 agent 协作中的幻觉和级联错误。

⭐⭐⭐⭐☆
causalexperimentragmulti_agentdata_collectionpricing客服与VOC知识图谱与RAG数据采集与治理MAS与智能体工程定价与利润

Multi-Agent Debate — 多智能体辩论共识

10-MAS

- LLM 生成初始答案后,即使答案错误,也会在后续反思中"维护"这个答案

⭐⭐⭐☆☆
causalexperimentoptimizationrecommendationragmulti_agentpricing客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润

ParaManager — 小模型主编排:Agent-as-Tool 并行子任务分解

10-MAS

Agent-as-Tool 协议统一:ParaManager 将传统系统中异构的 Agent(具有内部状态、多轮推理能力)和 Tool(无状态函数调用)统一为标准化的 `AgentAsTool` 接口。每个动作单元暴露相同的 `invoke(input) -> result` 接口,同时携带显式状态反馈(`status`, `progress`, `output`),让编排器无需了解底层实现差异即可统一调度。

⭐⭐☆☆☆
causalexperimentforecastingoptimizationknowledge_graphmulti_agentpricingvisual_generation广告与投放供应链与补货推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润风控与合规视觉内容生成

ReAct — 推理与行动交替执行

10-MAS

ReAct (Reasoning + Acting) 提出了一种推理与行动交织的范式。核心洞察:纯推理(Chain-of-Thought)容易幻觉,纯行动(Tool Use)缺乏规划——只有把两者交替进行,才能既保持思维连贯性又确保信息准确性。

⭐⭐⭐☆☆
causalexperimentmulti_agentpricing广告与投放客服与VOC推荐与搜索MAS与智能体工程定价与利润

Reflexion — 言语强化学习与自我反思

10-MAS

Reflexion 提出了一种言语强化学习(Verbal Reinforcement Learning)机制。核心洞察:传统 RL 需要更新模型权重,成本高且难以解释;而 LLM 可以通过自然语言形式的"自我反思"来改进策略,无需任何权重更新。

⭐⭐⭐⭐☆
causalexperimentoptimizationmulti_agentpricing供应链与补货客服与VOCMAS与智能体工程定价与利润

Self-Refine + RL — 反馈闭环与自进化 Agent

10-MAS

Self-Refine 是一种让 Agent 对自身输出进行批评和改进的迭代机制。核心洞察:语言模型不仅能生成内容,也能评估和改进内容——利用同一模型的双重能力,实现无需外部监督的自我进化。

⭐⭐⭐⭐☆
causalexperimentoptimizationmulti_agent客服与VOC数据采集与治理MAS与智能体工程

Skill Registry — 技能注册表与动态发现

10-MAS

Skill Registry 是 MAS 工作流的核心基础设施,负责管理所有可用技能的元数据、依赖关系和运行时状态。核心洞察:一个可扩展的多 Agent 系统必须能动态发现、加载和组合技能,而不是硬编码固定流程。

⭐⭐⭐☆☆
experimentmulti_agent客服与VOC数据采集与治理MAS与智能体工程

Subagent Decomposer — 复杂任务子智能体分解

10-MAS

Subagent Decomposer 负责将复杂的 Task Blueprint 分解为可独立执行的子任务,并分配给专门的子 Agent。核心洞察:复杂任务(如"生成全品类 VOC 周报")无法由单个 Agent 高效完成,必须分解为并行/串行的子任务,每个子任务由最优技能的子 Agent 执行。

36万⭐⭐⭐⭐☆
experimentrecommendationmulti_agentpricing客服与VOC推荐与搜索MAS与智能体工程定价与利润

Tree of Thoughts — 树搜索式任务规划

10-MAS

Tree of Thoughts (ToT) 将 LLM 的推理过程从线性链式思维(Chain-of-Thought)扩展为树状搜索。核心洞察:人类解决复杂问题时会探索多条路径、评估中间进展、在死胡同回溯——LLM 也应该具备这种"深思熟虑"的能力。

⭐⭐⭐⭐☆
causalexperimentoptimizationrecommendationmulti_agentpricing客服与VOC推荐与搜索MAS与智能体工程定价与利润