paper2skills Playbook

AIGP — LLM 动态定价:长期 GMV 对齐框架(+13% GMV A/B实测)

Skill-AIGP-LLM-Dynamic-Pricing · 17-价格优化

experimentforecastingoptimizationrecommendationpricing供应链与补货客服与VOC推荐与搜索定价与利润WF-A 智能补货WF-C 客服分诊WF-E Review监控WF-F 动态定价WF-G Listing内容优化WF-H 复购增长
年化 ROI1,321 万元
业务优先级⭐⭐⭐⭐⭐
业务视角
适用角色定价负责人 / 运营负责人 · 选品负责人 · CEO
适用平台Amazon Buy Box 竞价策略 · 多市场价格协调 · Prime Day / Coupon 折扣优化
什么情况下用竞品突然降价,不知道该不该跟,跟了怕伤利润不跟怕丢 BSR;大促期间不知道折扣给多少,给多了利润没了
成功是什么样的实时监控竞品价格并自动触发调价,毛利率保持在目标区间,BSR 排名和利润同时兼顾
业务痛点
竞品降价了不知道要不要跟大促折扣给多少没有依据手动盯价格太累反应不及时新品上线定价高了还是低了

1. 解决的问题

业务痛点:吸奶器年度销量呈强季节性(Q3-Q4 旺季 GMV 占全年 65%),且 Momcozy 经常在大促前一周大幅降价抢占位次

2. 核心算法逻辑

传统 RL 定价只优化短期收益(当日 GMV / 点击转化),忽视了跨周期的用户粘性损耗:盲目降价快速促单,但破坏品牌溢价 → 用户形成"等降价"心理锚点 → 长期 LTV 下降。AIGP 的核心创新是将 LLM 可解释决策与离线 RL 长期价值估计解耦组合,做到"今天的定价对三个月后的 GMV 负责"。

3. 业务应用场景

业务痛点:吸奶器年度销量呈强季节性(Q3-Q4 旺季 GMV 占全年 65%),且 Momcozy 经常在大促前一周大幅降价抢占位次。传统做法是手动跟价,但往往降太多伤利润或降太少丢份额。

AIGP 如何做长期 GMV 最优而非单日最优:

| 情景 | 短期 RL 的错误行为 | AIGP 的长期最优策略 | |------|-----------------|--------------------| | 旺季(10-11 月) | 看到流量高涨,降价冲 BSR 排名 | LTVE 识别旺季需求非弹性($|\epsilon| \approx 0.7$),维持高价最大化利润;优先保障品牌溢价形成 Q1 复购基础 | | 淡季(2-4 月) | 需求低迷,大幅降价清库存 | LTVE 评估降价带来的"廉价锚点"会压制旺季复购,建议 -5% 微调 + 赠品套装组合,维护品牌调性 | | 竞品降价(Momcozy -20%) | 立即

4. 输入数据要求

请查看原始代码模板获取输入规格。

5. 输出结果

请查看原始代码模板获取输出规格。

6. 业务价值 / ROI

  • 需要 LLM API 接入(生产环境建议 70B+ 模型或专属微调)
  • LTVE 训练需至少 6 个月高质量历史价格-销量配对数据
  • DPO 偏好数据标注需业务团队配合(正负样本定义)
  • 生产蒸馏部署需 MLOps 基础设施

7. 代码模板

代码块数量:1 · 路径:未检测到

"""
AIGP Dynamic Pricing — LLM + LTVE + DPO 长期 GMV 对齐框架
论文: AIGP: An LLM-Based Framework for Long-Term Value Alignment in E-Commerce Pricing
ICLR 2026 Workshop | 真实电商平台 A/B 实测 GMV +13.21%
"""

from dataclasses import dataclass, field
from typing import List, Optional, Tuple
import numpy as np
import random


@dataclass
class PricingContext:
    """定价上下文数据类"""
    sku_id: str
    current_price: float
    cost: float
    competitor_prices: List[float]          # 竞品价格列表
    demand_history: List[float]             # 历史日销量(最近 30 天)
    season: str                              # "peak" | "off" | "normal"
    days_since_launch: int = 0              # 新品冷启天数,0 = 成熟品
    review_count: int = 0                   # 评论数量
    inventory_days: float = 60.0            # 库存可销天数


@dataclass
class PricingDecision:
    """定价决策输出"""
    sku_id: str
    recommended_price: float
    ltve_score: float                        # 长期价值评分 (0-1)
    reasoning: str                           # LLM 推理链
    confidence: float                        # 决策置信度
    price_range: Tuple[float, float] = (0, 0)


class LTVEEstimator:
    """
    Long-Term Value Estimator — 离线 RL 价值估计(简化版)
    用历史销售数据拟合 Q 函数,估算定价决策的长期 GMV 期望
    """
    
    def __init__(self, gamma: float = 0.95, horizon: int = 90):
        self.gamma = gamma           # 折扣因子
        self.horizon = horizon       # 价值估算周期(天)
        self.q_table = {}            # 简化版 Q-table: (price_bucket, season) -> value
        self.fitted = False
    
    def _price_bucket(self, price: float, base_price: float) -> str:
        """将价格归入相对于基准价的桶"""
        ratio = price / base_price
        if ratio < 0.85:
            return "deep_discount"
        elif ratio < 0.95:
            return "discount"
        elif ratio < 1.05:
            return "normal"
        elif ratio < 1.15:
            return "premium"

8. 论文来源

未自动抽取;请查看原始 Skill 卡片。