Data Provenance & Lineage — 数据血缘追踪:LLM 训练数据溯源与 AI 法规合规
Skill-Data-Provenance-Lineage · 22-数据采集工程
experimentrecommendationmulti_agentdata_collection推荐与搜索数据采集与治理MAS与智能体工程风控与合规WF-E Review监控
收录于数据治理基础手册
实现难度⭐⭐⭐☆☆
业务优先级⭐⭐⭐☆☆
业务视角
适用角色数据工程师 / 技术负责人 · 运营负责人 · 选品负责人
适用平台Amazon SP API + Keepa · TikTok Shop API · 跨境多平台数据湖
什么情况下用想监控竞品价格/评论/排名但没有稳定采集能力,手动太慢;多平台数据分散整合成本极高;数据管道不稳定经常断
成功是什么样的竞品价格/评论数据每日自动更新,多平台数据统一入仓,数据管道稳定性 >99%,取数时间从小时降到分钟
业务痛点
1. 解决的问题
论文:Tracing Roots [2604.10480] + DEBUGLM [2603.17884]
2. 核心算法逻辑
论文:Tracing Roots [2604.10480] + DEBUGLM [2603.17884]
3. 业务应用场景
**母婴跨境电商应用**:追踪商品推荐/风控模型的训练数据来源,满足 EU AI Act 等法规审计要求
4. 输入数据要求
请查看原始代码模板获取输入规格。
5. 输出结果
请查看原始代码模板获取输出规格。
6. 业务价值 / ROI
未自动抽取;请查看原始 Skill 卡片。
7. 代码模板
代码块数量:0 · 路径:未检测到
请查看原始 Skill 卡片获取完整代码。
8. 论文来源
- 2601.14311
- 2603.17884
- 2604.10480