Cross-Validation Strategies(交叉验证策略)
12-ML基础
交叉验证解决"模型在未知数据上表现如何"的问题——不是依赖一次 train/test split 的"运气",而是通过多次切分平均来获得稳健的泛化能力估计。
Feature engineering, model evaluation, drift detection, performance monitor
12-ML基础
交叉验证解决"模型在未知数据上表现如何"的问题——不是依赖一次 train/test split 的"运气",而是通过多次切分平均来获得稳健的泛化能力估计。
12-ML基础
核心思想:生产 ML 模型上线后,输入数据的分布会随时间偏移(用户行为变化、季节性、竞品冲击),导致模型悄然失效。数据漂移检测通过持续监控特征分布(统计漂移)和预测误差(性能漂移)两条并行轨道,在模型失效前触发告警和重训——区别于异常检测,漂移检测关注的是系统性、持续性的分布偏移,而非偶发性异常点。
12-ML基础
跨境平台上架 50 款新款婴儿车,无任何历史购买数据,纯 ID 嵌入无法初始化,导致新品在推荐系统中几乎不曝光(冷启动问题)
12-ML基础
单独用 XGBoost 预测流失 AUC=0.82,单独用 LightGBM AUC=0.81,单独用 Random Forest AUC=0.78
12-ML基础
核心问题:模型效果的上限由特征质量决定。同样的算法,好的特征 vs 差的特征,效果可能差3-5倍。特征工程是"把领域知识注入模型的艺术"。
12-ML基础
我们从多个数据源(CRM、广告平台、网站分析、客服系统)汇总了 200+ 特征
12-ML基础
默认参数的 XGBoost 流失预测 AUC=0.78,希望通过超参调优提升到 0.82+
12-ML基础
流失率 5%,直接用 XGBoost 训练,Recall 只有 0.3——70% 的流失用户没被识别
12-ML基础
模型评估体系解决"模型到底好不好"这个问题——不是凭感觉,而是用标准化的量化指标从多个维度衡量模型表现。这是所有预测建模的基础能力,也是 ML 工程中模型选型、A/B 测试结果判读、生产监控的必备技能。
12-ML基础
核心思想:数据漂移检测(Skill-Data-Drift-Detection)解决的是"输入变了吗",模型性能监控解决的是"输出还准吗"。两者共同构成生产 ML 模型的完整健康体系。性能监控通过滑动窗口持续评估 AUC/MAPE 等指标,配合 Shadow Mode(新模型静默跑)和 Champion-Challenger(A/B 对比)两种灰度部署模式,在不影响生产的前提下验证新版本并安全切换。
12-ML基础
1. 稀疏性:长尾 SKU 历史销量不足(< 30 天),传统特征工程无法直接应用