任务自适应拓扑路由 — AdaptOrch 动态多智能体编排
Skill-Task-Adaptive-Topology · 16-智能体工程
1. 解决的问题
AdaptOrch 针对 LLM 能力收敛趋势(2026 年前沿模型 MMLU/HumanEval 差距 <5%)提出一个关键洞察:当个体模型能力趋同时,编排拓扑(拓扑选择) 的方差贡献远超 模型选择 的贡献,成为系统性能的主变量。
2. 核心算法逻辑
AdaptOrch 针对 LLM 能力收敛趋势(2026 年前沿模型 MMLU/HumanEval 差距 <5%)提出一个关键洞察:当个体模型能力趋同时,编排拓扑(拓扑选择) 的方差贡献远超 模型选择 的贡献,成为系统性能的主变量。
3. 业务应用场景
跨境母婴客服每天处理 3k+ 工单,类型多样: - 简单查询(物流追踪、尺码对照):1 个子任务,独立 - 流程型(过敏→退款→物流):3 个子任务,链式依赖 - 复杂仲裁(多国家法规+QC+财务审核):5-8 个子任务,高耦合 - 批量处理(50 单同时查状态):50 个子任务,完全独立
现状用固定拓扑(全部 sequential 或全部 parallel),效率低。
- 准确率:固定 sequential → AdaptOrch = +9.8pp (参考 SWE-bench) - 延迟:固定 parallel(1.4×) → AdaptOrch(1.6×) ≈ 接近,但准确率更高 - 成本:固定 parallel(52K token) → AdaptOrch(41.8K token) = -20% - 工单分级:简单查询 → τ_P(并发快),复杂仲裁 → τ_H(lead agent 仲裁)
4. 输入数据要求
请查看原始代码模板获取输入规格。
5. 输出结果
请查看原始代码模板获取输出规格。
6. 业务价值 / ROI
- 数据要求:中,需历史任务分解 + 耦合标注
- 技术门槛:中高,需懂 DAG 算法 + 拓扑路由 + embedding 合成
- 工程复杂度:高,4 种 executor + decomposer + synthesizer
- 维护成本:中低,阈值校准每年一次,decomposer prompt 按需更新
- 方法论价值极高:首个把拓扑选择形式化为 DAG 分析的框架
- 直接可落地:纯 prompt+算法,不需训练模型
7. 代码模板
代码块数量:4 · 路径:paper2skills-code/llm_agent_engineering/task_adaptive_topology
cd paper2skills-code/llm_agent_engineering/task_adaptive_topology
python3 adaptorch.py
8. 论文来源
- 2602.16873