Tool Call Decision Framework — 必要性/效用/可负担性三维工具调用决策
Skill-Tool-Call-Decision-Framework · 16-智能体工程
1. 解决的问题
LLM 工具调用存在系统性错位:模型既会过度调用(把可推理的问题交给工具),也会遗漏调用(低估工具对复杂查询的价值)。根本原因在于模型自感知与任务实际需求之间存在认知盲区——模型过度自信于自身知识覆盖,却对边界外的未知盲区无感知。
2. 核心算法逻辑
LLM 工具调用存在系统性错位:模型既会过度调用(把可推理的问题交给工具),也会遗漏调用(低估工具对复杂查询的价值)。根本原因在于模型自感知与任务实际需求之间存在认知盲区——模型过度自信于自身知识覆盖,却对边界外的未知盲区无感知。
3. 业务应用场景
业务问题:选品 Agent 包含三个 API(市场搜索 / 价格查询 / 合规检查)。当前每次扫描固定调用全部工具,即便对热门品类(婴儿奶粉/纸尿裤)的常规扫描,价格数据已在 Agent 上下文中,合规规则也属已知,仍重复调用,每次扫描 10 次 API → 月均 1000 次扫描 = 10,000 次 API 调用,其中估计 40% 冗余。
三维决策介入: - 对"纸尿裤常规价格查询":Necessity=0.3(模型已有 30 天内数据),直接 SKIP - 对"新品类合规检查":Necessity=0.9 + Utility=0.95 → 强制 CALL - 对"促销期价格波动查询":Affordability 根据剩余 token 预算动态调整
量化效果: - 每次扫描调用次数:10 → 6(减少 40%) - 月节省成本:$200(按 API 单价 $0.02/次 × 10,000 次 × 40%) - Agent 延迟降低 35%(串行 API 调用减少)
4. 输入数据要求
请查看原始代码模板获取输入规格。
5. 输出结果
请查看原始代码模板获取输出规格。
6. 业务价值 / ROI
- 直接节省 API 成本:$200-$500/月
- 减少 hallucination 导致的客服升级成本:$300-$800/月
- 合计:$500-$1300/月 → 年化 $6,000-$15,600
7. 代码模板
代码块数量:1 · 路径:未检测到
# 完整实现见 paper2skills-code/llm_agent_engineering/tool_call_decision/model.py
8. 论文来源
- 2605.00737