AIGP — LLM 动态定价:长期 GMV 对齐框架(+13% GMV A/B实测)
Skill-AIGP-LLM-Dynamic-Pricing · 17-价格优化
experimentforecastingoptimizationrecommendationpricing供应链与补货客服与VOC推荐与搜索定价与利润WF-A 智能补货WF-C 客服分诊WF-E Review监控WF-F 动态定价WF-G Listing内容优化WF-H 复购增长
年化 ROI1,321 万元
业务优先级⭐⭐⭐⭐⭐
业务视角
适用角色定价负责人 / 运营负责人 · 选品负责人 · CEO
适用平台Amazon Buy Box 竞价策略 · 多市场价格协调 · Prime Day / Coupon 折扣优化
什么情况下用竞品突然降价,不知道该不该跟,跟了怕伤利润不跟怕丢 BSR;大促期间不知道折扣给多少,给多了利润没了
成功是什么样的实时监控竞品价格并自动触发调价,毛利率保持在目标区间,BSR 排名和利润同时兼顾
业务痛点
1. 解决的问题
业务痛点:吸奶器年度销量呈强季节性(Q3-Q4 旺季 GMV 占全年 65%),且 Momcozy 经常在大促前一周大幅降价抢占位次
2. 核心算法逻辑
传统 RL 定价只优化短期收益(当日 GMV / 点击转化),忽视了跨周期的用户粘性损耗:盲目降价快速促单,但破坏品牌溢价 → 用户形成"等降价"心理锚点 → 长期 LTV 下降。AIGP 的核心创新是将 LLM 可解释决策与离线 RL 长期价值估计解耦组合,做到"今天的定价对三个月后的 GMV 负责"。
3. 业务应用场景
业务痛点:吸奶器年度销量呈强季节性(Q3-Q4 旺季 GMV 占全年 65%),且 Momcozy 经常在大促前一周大幅降价抢占位次。传统做法是手动跟价,但往往降太多伤利润或降太少丢份额。
AIGP 如何做长期 GMV 最优而非单日最优:
| 情景 | 短期 RL 的错误行为 | AIGP 的长期最优策略 | |------|-----------------|--------------------| | 旺季(10-11 月) | 看到流量高涨,降价冲 BSR 排名 | LTVE 识别旺季需求非弹性($|\epsilon| \approx 0.7$),维持高价最大化利润;优先保障品牌溢价形成 Q1 复购基础 | | 淡季(2-4 月) | 需求低迷,大幅降价清库存 | LTVE 评估降价带来的"廉价锚点"会压制旺季复购,建议 -5% 微调 + 赠品套装组合,维护品牌调性 | | 竞品降价(Momcozy -20%) | 立即
4. 输入数据要求
请查看原始代码模板获取输入规格。
5. 输出结果
请查看原始代码模板获取输出规格。
6. 业务价值 / ROI
- 需要 LLM API 接入(生产环境建议 70B+ 模型或专属微调)
- LTVE 训练需至少 6 个月高质量历史价格-销量配对数据
- DPO 偏好数据标注需业务团队配合(正负样本定义)
- 生产蒸馏部署需 MLOps 基础设施
7. 代码模板
代码块数量:1 · 路径:未检测到
"""
AIGP Dynamic Pricing — LLM + LTVE + DPO 长期 GMV 对齐框架
论文: AIGP: An LLM-Based Framework for Long-Term Value Alignment in E-Commerce Pricing
ICLR 2026 Workshop | 真实电商平台 A/B 实测 GMV +13.21%
"""
from dataclasses import dataclass, field
from typing import List, Optional, Tuple
import numpy as np
import random
@dataclass
class PricingContext:
"""定价上下文数据类"""
sku_id: str
current_price: float
cost: float
competitor_prices: List[float] # 竞品价格列表
demand_history: List[float] # 历史日销量(最近 30 天)
season: str # "peak" | "off" | "normal"
days_since_launch: int = 0 # 新品冷启天数,0 = 成熟品
review_count: int = 0 # 评论数量
inventory_days: float = 60.0 # 库存可销天数
@dataclass
class PricingDecision:
"""定价决策输出"""
sku_id: str
recommended_price: float
ltve_score: float # 长期价值评分 (0-1)
reasoning: str # LLM 推理链
confidence: float # 决策置信度
price_range: Tuple[float, float] = (0, 0)
class LTVEEstimator:
"""
Long-Term Value Estimator — 离线 RL 价值估计(简化版)
用历史销售数据拟合 Q 函数,估算定价决策的长期 GMV 期望
"""
def __init__(self, gamma: float = 0.95, horizon: int = 90):
self.gamma = gamma # 折扣因子
self.horizon = horizon # 价值估算周期(天)
self.q_table = {} # 简化版 Q-table: (price_bucket, season) -> value
self.fitted = False
def _price_bucket(self, price: float, base_price: float) -> str:
"""将价格归入相对于基准价的桶"""
ratio = price / base_price
if ratio < 0.85:
return "deep_discount"
elif ratio < 0.95:
return "discount"
elif ratio < 1.05:
return "normal"
elif ratio < 1.15:
return "premium"
8. 论文来源
未自动抽取;请查看原始 Skill 卡片。