① 问题 ② 算法 ③ 场景 ④ 代码 ⑤ 关联 ⑥ 价值

RTB Realtime Bidding Optimization — 生成式自动出价与多约束实时竞价优化

Skill-RTB-Realtime-Bidding-Optimization · 13-广告分析

causalexperimentoptimizationpricing广告与投放推荐与搜索定价与利润WF-B 广告优化WF-D 选品扫描WF-F 动态定价WF-G Listing内容优化WF-I 智能体工程WF-L 内容营销增长

收录于全渠道归因统一手册

年化 ROI30-100 万元

实现难度⭐⭐⭐⭐☆

业务优先级⭐⭐⭐⭐⭐

业务视角

适用角色广告优化师 / 投放负责人 · CMO · 运营负责人

适用平台Amazon PPC（SP/SB/SD）· TikTok Ads · Meta 广告 · 多平台归因

什么情况下用广告账户几十个系列，不知道哪个在真正赚钱；ROAS 看起来好看但实际利润没有提升；预算有限想集中打高价值用户

成功是什么样的每分广告预算有明确 ROI 追踪，砍掉低效渠道后同等预算 ROAS 提升 30-50%

业务痛点

ROAS 好看但利润没有涨不知道哪个素材真的有效归因窗口期不同数据打架TikTok/Meta/Amazon 广告数据整合不了

1. 解决的问题

母婴品牌 Amazon DSP/TikTok 广告按固定 CPA 出价，旺季预算提前耗尽或错过峰值时段——生成式 RTB 自动出价（Decision Transformer + Critics 投票）在预算约束下动态优化每次竞价，ROI 提升 3-5%，黑五大促 GMV 增量 15-20%，年化增量 GMV 30-100 万元

2. 核心算法逻辑

实时竞价（RTB）本质是在预算和 CPA/ROAS 约束下的序贯决策问题：广告主每次曝光机会需要在毫秒内决定出多少价，以在整个投放周期内最大化 GMV/ROI。

3. 业务应用场景

业务问题：某母婴品牌年度最大促销节点，预算 10 万元，历史黑五预算经常在第 2 天提前耗尽，后 3 天完全缺席，错失 30-40% 的 GMV 机会。人工按小时调 eCPC 上限，响应太慢。

数据要求： - 历史竞价日志（出价、清算价、是否赢拍、转化结果）30 天 - 竞品 CPM 区间（来自 Amazon 广告报告） - 产品类目 CVR（转化率）历史曲线

RTB 自动出价逻辑： - 状态：(剩余预算 / 总预算, 已过时段 / 总时段, 当前 win rate, 当前 CPA) - Critics 投票：Critic-1 偏好 ROI，Critic-2 偏好预算均衡消耗，Critic-3 偏好 CPA ≤ 目标 - 输出：每次竞价的动态出价（比固定 CPA 出价灵活 30-50%）

4. 输入数据要求

请查看原始代码模板获取输入规格。

5. 输出结果

请查看原始代码模板获取输出规格。

6. 业务价值 / ROI

30-100 万元

7. 代码模板

代码块数量：3 · 路径：未检测到

"""
RTB Realtime Bidding Optimization - 简化版实现
基于 GAS (arXiv:2412.17018) + GAVE (arXiv:2504.14587) 核心思想
实现：Critics 投票出价机制 + CPA/预算约束下的序贯决策
只依赖 numpy，无需 torch/transformers
"""

import numpy as np


# ───────── 环境模拟 ─────────
class RTBEnvironment:
    """模拟 RTB 竞价市场环境"""

    def __init__(self, n_slots=100, budget=1000.0, target_cpa=30.0, seed=42):
        self.n_slots = n_slots
        self.budget = budget
        self.target_cpa = target_cpa
        self.rng = np.random.default_rng(seed)

    def sample_auction(self, t: int, scenario: str = "normal"):
        """
        模拟一次拍卖机会
        返回：(market_price, ad_value, cvr)
        - market_price: 赢拍所需最低清算价（元/click，eCPC 口径）
        - ad_value: 该流量预估 GMV（元，点击后转化价值）
        - cvr: 该流量转化率（0-1）
        量纲说明：market_price ~ 0.5-10 元/click，ad_value ~ 5-80 元，cvr ~ 1-25%
        """
        # 黑五场景：峰值期流量质量更高，竞争更激烈
        if scenario == "blackfriday":
            peak = 1.0 + 0.8 * np.sin(np.pi * t / self.n_slots)  # 曲线峰值
            market_price = self.rng.lognormal(1.2, 0.5) * peak
            ad_value = self.rng.lognormal(3.5, 0.4) * peak
            cvr = np.clip(self.rng.beta(2, 8) * peak * 0.8, 0.01, 0.35)
        else:
            market_price = self.rng.lognormal(1.2, 0.5)   # 均值 ≈ 3.6 元/click
            ad_value = self.rng.lognormal(3.2, 0.4)       # 均值 ≈ 26 元/GMV
            cvr = np.clip(self.rng.beta(2, 8), 0.01, 0.25)  # 均值 ≈ 20%
        return market_price, ad_value, cvr


# ───────── Critics 出价评估 ─────────
class BiddingCritic:
    """
    三个偏好不同的 Critics，对候选出价投票
    模拟 GAS 的 MCTS 风格多目标搜索
    """

    @staticmethod
    def roi_critic(bid: float, ad_value: float, cvr: float,
                   remaining_budget: float, total_budget: float) -> float:
        """Critic-1：偏好 ROI，出价不超过预估价值"""
        expected_gmv = ad_value * cvr
        if bid <= 0:
            return 0.0
        roi = expected_gmv / bid
        # 预算使用率惩罚（避免过于保守导致预算浪费）
        budget_usage = 1.0 - remaining_budget / total_budget
        budget_bonus = 0.2 * budget_usage  # 预算消耗越多，适度鼓励出价

8. 论文来源

2412.17018
2504.14587

🧪 智能体广场调用案例

Agent：广告归因侦探（agent-ad-attribution）

测试输入：platform=Amazon DSP, spend=50000, target_acos=25%, scenario=blackfriday

输出摘要：基于 GAS RTB 模型的黑五出价策略，预算均匀消耗率 95%，ROI 提升 +3.8%，CPA 达标率 96.2%，建议 Critics 权重调整为 ROI:CPA:Pacing = 0.45:0.30:0.25

验证状态：✅ 本地计算通过 | 2026-06-13

→ 前往智能体广场运行