PASTA - 离线悲观选品框架

Skill-PASTA-Offline-Assortment · 04-供应链

causalexperimentforecastingoptimizationrecommendationragfraud_detectionpricing供应链与补货推荐与搜索知识图谱与RAG定价与利润风控与合规WF-A 智能补货WF-D 选品扫描WF-F 动态定价

年化 ROI15-30 万元

实现难度⭐⭐⭐☆☆

业务优先级⭐⭐⭐☆☆

业务视角

适用角色供应链负责人 · 采购负责人 · CEO / 运营 VP

适用平台Amazon FBA · 海外仓 · 多国仓位（美/欧/日）

什么情况下用库存周转率低，资金压在海外仓出不来；SKU 断货紧急空运，物流成本吃掉毛利；多仓库存分布不均

成功是什么样的库存周转天数从 90 天降到 60 天，断货率 <3%，海外仓综合成本降低 15-25%

业务痛点

库存周转天数太长资金压死了断货了只能空运救急成本爆了多市场库存分配不均

1. 解决的问题

如何仅凭历史离线日志（无需在线试错），找出使总期望收益最大化的商品展示组合。

2. 核心算法逻辑

PASTA（Pessimistic AsSorTment leArning）解决的核心问题是：如何仅凭历史离线日志（无需在线试错），找出使总期望收益最大化的商品展示组合。面对 N 个 SKU 的 $2^N$ 种候选组合，传统在线方法需要真实上架实验，代价过高；PASTA 用"悲观原则"规避这一困境。

3. 业务应用场景

业务问题：大促期间运营提报 200 个 SKU，首屏仅 8 个黄金坑位。若直接取历史销量 Top-8，可能全是"电动奶泵"，彼此抢占转化率（MNL 替代效应）。需要找到整体期望 GMV 最高、互补性最强的 8 品组合。

数据要求： - 过去一年各 SKU 在历史页面中的曝光记录（展示组合 + 用户最终选择） - 每个 SKU 的售价 / 毛利 - 至少保证入围 SKU 每个单品有 ≥10 次曝光记录（Single-item coverage）

预期产出： - 最优 8 品组合 + 最坏情况期望收益下界 - 每个 SKU 的不确定性半径（$\beta_j$）及风险等级 - 对比朴素 Top-K 方案的收益提升量（实测 demo 提升 26%+）

4. 输入数据要求

请查看原始代码模板获取输入规格。

5. 输出结果

请查看原始代码模板获取输出规格。

6. 业务价值 / ROI

数据要求：需要结构化的曝光+选择日志（通常在 OLAP 日志系统中可获取）
技术门槛：中等，需理解 MNL 模型；贪婪算法工程落地门槛低
工程复杂度：中等，穷举仅适用于 N≤20；N>50 需结合分支定界或启发式
维护成本：低，模型随日志自动更新无需人工干预

7. 代码模板

代码块数量：1 · 路径：未检测到

from model import HistoricalLog, PASTAOptimizer
import numpy as np

# 1. 准备历史日志（替换为真实业务数据）
log = HistoricalLog(n_items=20, n_obs=2000, seed=42)

# 2. 配置 SKU 定价
prices = np.array([...])  # shape: (n_items,)，单位：元

# 3. 构建 PASTA 优化器
optimizer = PASTAOptimizer(
    n_items=20,
    capacity=8,            # 首屏坑位数
    prices=prices,
    confidence_level=0.9   # 置信水平，越高越保守
)
optimizer.fit(log)

# 4. 执行 Max-Min 贪婪选品
best_set, worst_rev, detail_df = optimizer.optimize_greedy()

print(f"推荐上架组合: {best_set}")
print(f"最坏情况期望收益: ¥{worst_rev:.2f}")
print(detail_df[detail_df["selected"]])

8. 论文来源

2510.01693