Shopping Companion — 记忆增强的长期偏好购物 Agent

Skill-Long-Term-Preference-Memory · 16-智能体工程

experimentoptimizationrecommendationragmulti_agentpricing广告与投放供应链与补货客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润WF-A 智能补货WF-B 广告优化WF-C 客服分诊WF-D 选品扫描WF-F 动态定价WF-H 复购增长

收录于用户增长决策手册

实现难度⭐⭐⭐⭐☆

业务优先级⭐⭐⭐⭐☆

业务视角

适用角色CTO / 技术负责人 · 产品经理 · 数据工程师

适用平台跨境运营 AI Agent 工程落地 · Amazon SP API + LLM 集成 · 多平台数据采集 Agent

什么情况下用想把 AI 集成到业务系统，但 LLM 稳定性差、幻觉问题、成本控制都是挑战；Agent 任务失败了不知道哪步出了问题

成功是什么样的AI Agent 在生产环境稳定运行，失败可追踪，成本可控，复杂任务完成率 >85%

业务痛点

LLM 返回结果不稳定不可靠AI 幻觉导致业务决策错误Agent 任务失败了不知道哪步出问题AI 调用成本控制不住

1. 解决的问题

Shopping Companion 解决两个长期被忽视的问题:(1) 缺少能评估跨 session 偏好记忆的端到端购物 benchmark;(2) 现有方法把"偏好识别"和"购物执行"当作独立模块,没有端到端联合优化。它把购物 Agent 形式化为 POMDP,并提出两阶段统一框架 + 双奖励 RL 训练。

2. 核心算法逻辑

3. 业务应用场景

母婴用户的生命周期天然就是"长周期":怀孕 9 个月 + 0-3 岁宝宝 = 接近 4 年的购物窗口。期间偏好不断演化:

- 早期:孕妇装、孕妇维生素、待产包 - 0-6 个月:奶粉品牌、纸尿裤尺码、湿巾过敏属性 - 6-12 个月:辅食、米粉品牌、餐具材质 - 1-3 岁:童装、玩具、英语启蒙

跨境平台(独立站 + Amazon + TikTok Shop)对话是分裂的,传统推荐忽略跨 session 偏好,导致复购推荐不精准。

4. 输入数据要求

请查看原始代码模板获取输入规格。

5. 输出结果

请查看原始代码模板获取输出规格。

6. 业务价值 / ROI

数据要求:中高,需要 6+ 月历史对话和结构化产品库
技术门槛:高,需要 RL fine-tuning + dual reward 设计
工程复杂度:高,需要 memory + product 两套检索基础设施
维护成本:中,工具调用 schema 变更需要重训
业务价值极高:母婴长周期天然适配,跨境多平台天然需要跨 session memory
小模型友好:论文用 Qwen3-4B + LoRA + RL 击败 GPT-4o,显著降本

7. 代码模板

代码块数量：3 · 路径：paper2skills-code/llm_agent_engineering/long_term_preference_memory

cd paper2skills-code/llm_agent_engineering/long_term_preference_memory
python shopping_companion.py

8. 论文来源

2410.10813
2601.01885
2603.14864