12-ML基础

Feature engineering, model evaluation, drift detection, performance monitor

Cross-Validation Strategies（交叉验证策略）

12-ML基础

交叉验证解决"模型在未知数据上表现如何"的问题——不是依赖一次 train/test split 的"运气"，而是通过多次切分平均来获得稳健的泛化能力估计。

3-5 万⭐⭐☆☆☆

forecasting供应链与补货推荐与搜索MAS与智能体工程

Skill-Data-Drift-Detection

12-ML基础

核心思想：生产 ML 模型上线后，输入数据的分布会随时间偏移（用户行为变化、季节性、竞品冲击），导致模型悄然失效。数据漂移检测通过持续监控特征分布（统计漂移）和预测误差（性能漂移）两条并行轨道，在模型失效前触发告警和重训——区别于异常检测，漂移检测关注的是系统性、持续性的分布偏移，而非偶发性异常点。

⭐⭐☆☆☆

causalexperimentforecastingrecommendationpricing广告与投放供应链与补货客服与VOC推荐与搜索定价与利润

Embedding Fundamentals — 嵌入表示学习基础：从 ID 映射到多模态语义对齐

12-ML基础

跨境平台上架 50 款新款婴儿车，无任何历史购买数据，纯 ID 嵌入无法初始化，导致新品在推荐系统中几乎不曝光（冷启动问题）

15-50 万元⭐⭐⭐☆☆

causalexperimentrecommendationmulti_agentpricingvisual_generation供应链与补货推荐与搜索MAS与智能体工程定价与利润视觉内容生成

Ensemble Methods（集成学习方法）

12-ML基础

单独用 XGBoost 预测流失 AUC=0.82，单独用 LightGBM AUC=0.81，单独用 Random Forest AUC=0.78

40-80 万元⭐⭐⭐☆☆

forecasting广告与投放MAS与智能体工程

Feature Engineering for E-Commerce Machine Learning

12-ML基础

核心问题：模型效果的上限由特征质量决定。同样的算法，好的特征 vs 差的特征，效果可能差3-5倍。特征工程是"把领域知识注入模型的艺术"。

⭐⭐⭐☆☆

causalexperimentforecastingrecommendationmulti_agentpricing客服与VOC推荐与搜索MAS与智能体工程定价与利润

Feature Selection（特征选择）

12-ML基础

我们从多个数据源（CRM、广告平台、网站分析、客服系统）汇总了 200+ 特征

30-60 万元⭐⭐⭐⭐☆

causalexperimentforecastingoptimizationdata_collection广告与投放客服与VOC数据采集与治理MAS与智能体工程

Hyperparameter Optimization（超参调优）

12-ML基础

默认参数的 XGBoost 流失预测 AUC=0.78，希望通过超参调优提升到 0.82+

50-100 万元⭐⭐⭐☆☆

causalexperimentforecastingoptimizationrecommendation广告与投放推荐与搜索MAS与智能体工程

Imbalanced Data Handling（不平衡数据处理）

12-ML基础

流失率 5%，直接用 XGBoost 训练，Recall 只有 0.3——70% 的流失用户没被识别

150-300 万元⭐⭐☆☆☆

causalforecasting广告与投放MAS与智能体工程

Model Evaluation Metrics（模型评估体系）

12-ML基础

模型评估体系解决"模型到底好不好"这个问题——不是凭感觉，而是用标准化的量化指标从多个维度衡量模型表现。这是所有预测建模的基础能力，也是 ML 工程中模型选型、A/B 测试结果判读、生产监控的必备技能。

5-8 万⭐⭐☆☆☆

causalexperimentforecastingrag广告与投放供应链与补货知识图谱与RAGMAS与智能体工程

Skill-Model-Performance-Monitor

12-ML基础

核心思想：数据漂移检测（Skill-Data-Drift-Detection）解决的是"输入变了吗"，模型性能监控解决的是"输出还准吗"。两者共同构成生产 ML 模型的完整健康体系。性能监控通过滑动窗口持续评估 AUC/MAPE 等指标，配合 Shadow Mode（新模型静默跑）和 Champion-Challenger（A/B 对比）两种灰度部署模式，在不影响生产的前提下验证新版本并安全切换。

⭐⭐☆☆☆

causalexperimentforecastingrecommendation供应链与补货推荐与搜索

Supply Chain ML Feature Engineering — 供应链 ML 特征工程：时序+图+统计三维

12-ML基础

1. 稀疏性：长尾 SKU 历史销量不足（< 30 天），传统特征工程无法直接应用

供应链 ML 模型准确率提升 15-20%，减少缺货/积压成本⭐⭐☆☆☆

causalexperimentforecasting广告与投放供应链与补货