AgeMem — 统一 LTM+STM 管理的 Agentic Memory
Skill-Agentic-Memory-Management · 16-智能体工程
causalexperimentoptimizationrecommendationragknowledge_graphmulti_agent广告与投放客服与VOC推荐与搜索知识图谱与RAG数据采集与治理MAS与智能体工程WF-B 广告优化WF-C 客服分诊WF-E Review监控WF-H 复购增长
年化 ROISTM Filter + Summary 让对话 context 维持紧凑
实现难度⭐⭐⭐⭐☆
业务优先级⭐⭐⭐⭐☆
业务视角
适用角色CTO / 技术负责人 · 产品经理 · 数据工程师
适用平台跨境运营 AI Agent 工程落地 · Amazon SP API + LLM 集成 · 多平台数据采集 Agent
什么情况下用想把 AI 集成到业务系统,但 LLM 稳定性差、幻觉问题、成本控制都是挑战;Agent 任务失败了不知道哪步出了问题
成功是什么样的AI Agent 在生产环境稳定运行,失败可追踪,成本可控,复杂任务完成率 >85%
业务痛点
1. 解决的问题
AgeMem(Agentic Memory) 颠覆了传统 LTM/STM 分离架构,把记忆管理整合到 Agent 的 policy 本身。现有方法把 LTM 与 STM 当作两个独立模块,要么用 trigger-based 启发式,要么外挂 Memory Manager,导致
2. 核心算法逻辑
AgeMem(Agentic Memory) 颠覆了传统 LTM/STM 分离架构,把记忆管理整合到 Agent 的 policy 本身。现有方法把 LTM 与 STM 当作两个独立模块,要么用 triggerbased 启发式,要么外挂 Memory Manager,导致:
3. 业务应用场景
母婴用户从孕期到 3 岁的完整生命周期,跨越 4 年、可能数百次交互。传统系统要么用 RAG(STM 一直膨胀)要么固定 trigger(每月强制总结),都不够精准。需要 Agent 自主决定:
- 哪些信息(过敏原、品牌偏好、宝宝月龄、产品满意度) 该存进 LTM - 哪些 context 该用 Filter 剔除(广告导流、闲聊) - 哪些 LTM 该 Update(月龄随时间增长) / Delete(过期偏好)
- 用户 4 年内全部对话历史 + 商品互动 + 客服记录 - HotpotQA 风格的"上下文 + 干扰 + 任务"训练对 - Ground-truth memory 标注(用于 RL 训 memory quality reward)
4. 输入数据要求
请查看原始代码模板获取输入规格。
5. 输出结果
请查看原始代码模板获取输出规格。
6. 业务价值 / ROI
- 数据要求:高,需要 HotpotQA 风格的标注训练集 5000+
- 技术门槛:高,Step-wise GRPO + 三阶段 progressive RL 需要 RL 经验
- 工程复杂度:高,需要部署 RL 训练管道 + LLM judge 评估
- 维护成本:中,RL 训练后 policy 可以长期复用
- 业务价值极高:与跨境母婴长周期场景高度契合
- 小模型友好:论文 Qwen2.5-7B / Qwen3-4B 都能用,显著降成本
7. 代码模板
代码块数量:3 · 路径:未检测到
cd paper2skills-code/llm_agent_engineering/agentic_memory
python agemem.py
8. 论文来源
- 2402.03300
- 2504.19413
- 2601.01885