Consumer Complaint Recall Prediction — 消费者投诉驱动的召回风险预测
Skill-Consumer-Complaint-Recall-Prediction · 21-合规决策
1. 解决的问题
核心思想:从 CPSC/NHTSA 非结构化消费者投诉文本出发,通过半参数主题模型(Hierarchical Dirichlet Process Pitman-Yor, HDPYP)自动提取缺陷主题,预测产品召回发生概率和召回组件类别。与传统 XGBoost/RF 相比,预测准确率提升约 14%(p<0.05),提前约 1 年预警召回事件。
2. 核心算法逻辑
核心思想:从 CPSC/NHTSA 非结构化消费者投诉文本出发,通过半参数主题模型(Hierarchical Dirichlet Process PitmanYor, HDPYP)自动提取缺陷主题,预测产品召回发生概率和召回组件类别。与传统 XGBoost/RF 相比,预测准确率提升约 14%(p<0.05),提前约 1 年预警召回事件。
3. 业务应用场景
场景 A:婴儿推车安全预警(提前 12 个月识别召回风险)
- 业务问题:在 Amazon 选品婴儿推车时,如何提前识别某款车型即将遭遇 CPSC 强制召回? - 数据来源:SaferProducts.gov 婴儿推车品类近 3 年投诉,约 800 条记录 - HDPYP 产出: - 主题 1(权重 0.47):`wheel`, `broken`, `collapse`, `sudden` → 车轮/折叠机构失效主题 - 主题 2(权重 0.31):`buckle`, `release`, `strap`, `fall` → 安全带扣解锁失效主题 - 主题集中度(Gini=0.72)超过阈值 0.60 → 高召回风险 - 预期效果:提前 12 个月标记
场景 B:WF-D 选品合规门控(品类级投诉集中度扫描)
4. 输入数据要求
请查看原始代码模板获取输入规格。
5. 输出结果
请查看原始代码模板获取输出规格。
6. 业务价值 / ROI
未自动抽取;请查看原始 Skill 卡片。
7. 代码模板
代码块数量:4 · 路径:未检测到
# 运行方式: python model.py
# 依赖: 纯 Python 标准库 (Python 3.8+)
from paper2skills_code.compliance.complaint_recall_prediction import (
ComplaintRecord,
LDATopicExtractor,
RecallRiskPredictor,
run_demo,
)
# 快速运行演示
if __name__ == "__main__":
run_demo()
8. 论文来源
未自动抽取;请查看原始 Skill 卡片。