paper2skills Playbook

Multi-Armed Bandit (多臂老虎机)

Skill-Multi-Armed-Bandit · 02-A_B实验

experimentforecastingoptimizationrecommendation广告与投放推荐与搜索WF-B 广告优化WF-G Listing内容优化
实现难度⭐⭐☆☆☆
业务视角
适用角色运营负责人 / 产品经理 · 广告优化师 · 选品负责人
适用平台Amazon Listing · TikTok 广告素材 · DTC 落地页
什么情况下用改了主图/标题/价格,不确定销量变化是改动导致的还是流量波动;两个方案团队各持己见,需要数据裁决
成功是什么样的每次改动都有 ≥95% 置信度的数据结论,好的改动快速全量,坏的及时止损
业务痛点
改了主图感觉好多了但不确定小范围测试结果好全量后没效果测试周期短结论不可靠

1. 解决的问题

在探索(exploration)和利用(exploitation)之间取得平衡。

2. 核心算法逻辑

多臂老虎机(MultiArmed Bandit, MAB)解决的核心问题是:在探索(exploration)和利用(exploitation)之间取得平衡。与传统 A/B 测试不同,MAB 在测试过程中动态调整流量分配,将更多流量分配给表现好的广告版本,同时继续探索其他版本,从而在保证学习效果的同时最大化收益。

3. 业务应用场景

业务问题: 我们在北美/澳洲投放吸奶器广告时,通常会准备多套广告素材(产品图片、使用场景图、妈妈晒单图、不同文案)。传统方法是固定流量分配 A/B 测试(如 50/50),但: - 效果差的素材浪费 50% 预算 - 测试周期长(至少 1-2 周) - 不确定性强,难以决策

使用 MAB 可以动态分配流量,自动淘汰差的素材,放大好的素材。

数据要求: - 广告素材 ID(如 "素材A-哺乳妈妈使用图"、"素材B-产品正面图") - 每条广告的曝光、点击、加购、购买数据 - 实时或 near-real-time 数据回流

4. 输入数据要求

请查看原始代码模板获取输入规格。

5. 输出结果

请查看原始代码模板获取输出规格。

6. 业务价值 / ROI

  • ROI 预估:相比 A/B 测试,MAB 可减少 20-40% 流量损耗,在探索阶段累计多转化 5-15%
  • 实施难度:⭐⭐☆☆☆(2星,标准 MAB 算法,有成熟库)
  • 优先级评分:⭐⭐⭐⭐☆(4星,适合高频迭代的广告/价格测试)

7. 代码模板

代码块数量:0 · 路径:paper2skills-code/ab_testing/multi_armed_bandit

请查看原始 Skill 卡片获取完整代码。

8. 论文来源

未自动抽取;请查看原始 Skill 卡片。