Causal Attribution Bridge(因果归因桥梁)
01-因果推断
传统广告归因是相关性的("点了广告→买了"),因果归因是反事实的("如果没有这个广告→还会买吗")。核心:用增量因果效应替代 naive 归因比例。
Causal inference, uplift modeling, DiD, IV
01-因果推断
传统广告归因是相关性的("点了广告→买了"),因果归因是反事实的("如果没有这个广告→还会买吗")。核心:用增量因果效应替代 naive 归因比例。
01-因果推断
传统队列分析(Cohort Analysis)追踪同一时期加入的用户群体的行为轨迹,但无法剥离选择偏差:高价值用户本来就会复购,促销只是"锦上添花"而非真正驱动因素。直接比较"接受促销的队列 vs 未接受促销的队列",会高估促销效果 30-60%。
01-因果推断
核心思想:从纯观测数据(无干预、无实验)中自动发现变量间的因果结构。PC 算法通过系统的条件独立性检验,逐步剔除无关边、识别 v-structures、传播方向约束,最终输出一个有向无环图(DAG)或部分定向图(CPDAG)。
01-因果推断
合成控制法(Synthetic Control, SC)通过为目标单元"合成"一个反事实来估计因果效应,是评估地区级/城市级无法做 A/B 的大型干预(如区域广告投放、城市政策)的黄金标准。
01-因果推断
rDRP(robust Direct ROI Prediction)在标准 DRP (Direct ROI Prediction, AAAI 2023) 基础上,用共形预测 + MC Dropout 做 ROI 区间估计,再通过启发式校准将区间信息融回点估计。
01-因果推断
共形预测的核心保证:共形预测(Conformal Prediction, CP)在无需分布假设的条件下,为任意黑盒预测模型提供覆盖率理论保证。对于置信水平 1-α(如 90%),输出的预测区间 `[lower, upper]` 在有限样本下满足:`P(y ∈ [lower, upper]) ≥ 1-α`。这一保证来自数据可交换性(exchangeability),而非 Gaussian 分布假设。
01-因果推断
平台对所有新妈妈用户统一发放"新生儿满减券",ROI 整体回归到 1.2-1.5x,猜测某些群体响应强、某些群体弱,但不知如何切分 - 数据要求:用户注册时填写宝宝生日 + 高维行为日志(2000 维:RFM、品类偏好、渠道、地理) - DML 配置: - 第一阶段:XGBoost 拟合 $E[Y|X]$,LightGBM 拟合 $E[D|X]$ - PCA 降维至 10 维,K-mea
01-因果推断
核心思想:利用处理组和对照组在政策/干预前后的变化差异来估计因果效应。基本逻辑是:如果没有干预,处理组的趋势应该与对照组平行(平行趋势假设)。干预后的实际差异减去趋势差异,就是干预的净效应。
01-因果推断
标准共形预测对所有数据点使用统一的非一致性分数,无法区分"数据多的区域"和"数据少的区域"。根本原因:传统共形分数只捕捉偶然不确定性(aleatoric uncertainty,数据本身的随机性),对认知不确定性(epistemic uncertainty,训练数据不足导致的模型无知)视而不见——在数据稀疏区域仍然给出窄区间,形成虚假的高置信度。
01-因果推断
当前做法是向所有"高流失风险"用户统一发"免费延长30天"优惠券,ROI 极低——很多用户即使不发券也会续订
01-因果推断
Momcozy 想知道自己产品的价格弹性——价格下降10%,销量会增加多少
01-因果推断
我们在美国、加拿大、英国、德国同步投放吸奶器广告,不同市场的用户行为差异显著
01-因果推断
核心思想:中介分析回答"为什么"——一个干预(如推荐算法更新)通过什么机制影响了结果(如转化率)。它将总效应分解为
01-因果推断
标准 Split Conformal Prediction 的覆盖保证是"期望意义"的——跨多次校准集随机抽取,平均覆盖率为 `1-α`,但单次校准的覆盖率可能远低于目标值。实验表明:当校准集 n=50 时,目标覆盖率 90% 的标准共形预测,实际违约率高达 ~40%(即 40% 的概率实际覆盖 < 90%)。
01-因果推断
识别哪些用户最有可能因为某个干预(如促销、广告)而产生正向行为。