Shopping Companion — 记忆增强的长期偏好购物 Agent
Skill-Long-Term-Preference-Memory · 16-智能体工程
experimentoptimizationrecommendationragmulti_agentpricing广告与投放供应链与补货客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润WF-A 智能补货WF-B 广告优化WF-C 客服分诊WF-D 选品扫描WF-F 动态定价WF-H 复购增长
收录于用户增长决策手册
实现难度⭐⭐⭐⭐☆
业务优先级⭐⭐⭐⭐☆
业务视角
适用角色CTO / 技术负责人 · 产品经理 · 数据工程师
适用平台跨境运营 AI Agent 工程落地 · Amazon SP API + LLM 集成 · 多平台数据采集 Agent
什么情况下用想把 AI 集成到业务系统,但 LLM 稳定性差、幻觉问题、成本控制都是挑战;Agent 任务失败了不知道哪步出了问题
成功是什么样的AI Agent 在生产环境稳定运行,失败可追踪,成本可控,复杂任务完成率 >85%
业务痛点
1. 解决的问题
Shopping Companion 解决两个长期被忽视的问题:(1) 缺少能评估跨 session 偏好记忆的端到端购物 benchmark;(2) 现有方法把"偏好识别"和"购物执行"当作独立模块,没有端到端联合优化。它把购物 Agent 形式化为 POMDP,并提出两阶段统一框架 + 双奖励 RL 训练。
2. 核心算法逻辑
Shopping Companion 解决两个长期被忽视的问题:(1) 缺少能评估跨 session 偏好记忆的端到端购物 benchmark;(2) 现有方法把"偏好识别"和"购物执行"当作独立模块,没有端到端联合优化。它把购物 Agent 形式化为 POMDP,并提出两阶段统一框架 + 双奖励 RL 训练。
3. 业务应用场景
母婴用户的生命周期天然就是"长周期":怀孕 9 个月 + 0-3 岁宝宝 = 接近 4 年的购物窗口。期间偏好不断演化:
- 早期:孕妇装、孕妇维生素、待产包 - 0-6 个月:奶粉品牌、纸尿裤尺码、湿巾过敏属性 - 6-12 个月:辅食、米粉品牌、餐具材质 - 1-3 岁:童装、玩具、英语启蒙
跨境平台(独立站 + Amazon + TikTok Shop)对话是分裂的,传统推荐忽略跨 session 偏好,导致复购推荐不精准。
4. 输入数据要求
请查看原始代码模板获取输入规格。
5. 输出结果
请查看原始代码模板获取输出规格。
6. 业务价值 / ROI
- 数据要求:中高,需要 6+ 月历史对话和结构化产品库
- 技术门槛:高,需要 RL fine-tuning + dual reward 设计
- 工程复杂度:高,需要 memory + product 两套检索基础设施
- 维护成本:中,工具调用 schema 变更需要重训
- 业务价值极高:母婴长周期天然适配,跨境多平台天然需要跨 session memory
- 小模型友好:论文用 Qwen3-4B + LoRA + RL 击败 GPT-4o,显著降本
7. 代码模板
代码块数量:3 · 路径:paper2skills-code/llm_agent_engineering/long_term_preference_memory
cd paper2skills-code/llm_agent_engineering/long_term_preference_memory
python shopping_companion.py
8. 论文来源
- 2410.10813
- 2601.01885
- 2603.14864