AgeMem — 统一 LTM+STM 管理的 Agentic Memory

Skill-Agentic-Memory-Management · 16-智能体工程

causalexperimentoptimizationrecommendationragknowledge_graphmulti_agent广告与投放客服与VOC推荐与搜索知识图谱与RAG数据采集与治理MAS与智能体工程WF-B 广告优化WF-C 客服分诊WF-E Review监控WF-H 复购增长

年化 ROISTM Filter + Summary 让对话 context 维持紧凑

实现难度⭐⭐⭐⭐☆

业务优先级⭐⭐⭐⭐☆

业务视角

适用角色CTO / 技术负责人 · 产品经理 · 数据工程师

适用平台跨境运营 AI Agent 工程落地 · Amazon SP API + LLM 集成 · 多平台数据采集 Agent

什么情况下用想把 AI 集成到业务系统，但 LLM 稳定性差、幻觉问题、成本控制都是挑战；Agent 任务失败了不知道哪步出了问题

成功是什么样的AI Agent 在生产环境稳定运行，失败可追踪，成本可控，复杂任务完成率 >85%

业务痛点

LLM 返回结果不稳定不可靠AI 幻觉导致业务决策错误Agent 任务失败了不知道哪步出问题AI 调用成本控制不住

1. 解决的问题

AgeMem(Agentic Memory) 颠覆了传统 LTM/STM 分离架构,把记忆管理整合到 Agent 的 policy 本身。现有方法把 LTM 与 STM 当作两个独立模块,要么用 trigger-based 启发式,要么外挂 Memory Manager,导致

2. 核心算法逻辑

AgeMem(Agentic Memory) 颠覆了传统 LTM/STM 分离架构,把记忆管理整合到 Agent 的 policy 本身。现有方法把 LTM 与 STM 当作两个独立模块,要么用 triggerbased 启发式,要么外挂 Memory Manager,导致:

3. 业务应用场景

母婴用户从孕期到 3 岁的完整生命周期,跨越 4 年、可能数百次交互。传统系统要么用 RAG(STM 一直膨胀)要么固定 trigger(每月强制总结),都不够精准。需要 Agent 自主决定:

- 哪些信息(过敏原、品牌偏好、宝宝月龄、产品满意度) 该存进 LTM - 哪些 context 该用 Filter 剔除(广告导流、闲聊) - 哪些 LTM 该 Update(月龄随时间增长) / Delete(过期偏好)

- 用户 4 年内全部对话历史 + 商品互动 + 客服记录 - HotpotQA 风格的"上下文 + 干扰 + 任务"训练对 - Ground-truth memory 标注(用于 RL 训 memory quality reward)

4. 输入数据要求

请查看原始代码模板获取输入规格。

5. 输出结果

请查看原始代码模板获取输出规格。

6. 业务价值 / ROI

数据要求:高,需要 HotpotQA 风格的标注训练集 5000+
技术门槛:高,Step-wise GRPO + 三阶段 progressive RL 需要 RL 经验
工程复杂度:高,需要部署 RL 训练管道 + LLM judge 评估
维护成本:中,RL 训练后 policy 可以长期复用
业务价值极高:与跨境母婴长周期场景高度契合
小模型友好:论文 Qwen2.5-7B / Qwen3-4B 都能用,显著降成本

7. 代码模板

代码块数量：3 · 路径：未检测到

cd paper2skills-code/llm_agent_engineering/agentic_memory
python agemem.py

8. 论文来源

2402.03300
2504.19413
2601.01885