paper2skills Playbook

Data Provenance & Lineage — 数据血缘追踪:LLM 训练数据溯源与 AI 法规合规

Skill-Data-Provenance-Lineage · 22-数据采集工程

experimentrecommendationmulti_agentdata_collection推荐与搜索数据采集与治理MAS与智能体工程风控与合规WF-E Review监控
实现难度⭐⭐⭐☆☆
业务优先级⭐⭐⭐☆☆
业务视角
适用角色数据工程师 / 技术负责人 · 运营负责人 · 选品负责人
适用平台Amazon SP API + Keepa · TikTok Shop API · 跨境多平台数据湖
什么情况下用想监控竞品价格/评论/排名但没有稳定采集能力,手动太慢;多平台数据分散整合成本极高;数据管道不稳定经常断
成功是什么样的竞品价格/评论数据每日自动更新,多平台数据统一入仓,数据管道稳定性 >99%,取数时间从小时降到分钟
业务痛点
竞品数据要手动收集太慢平台 API 限制抓不到数据多系统数据整合不起来报表用的数据是过期的

1. 解决的问题

论文:Tracing Roots [2604.10480] + DEBUGLM [2603.17884]

2. 核心算法逻辑

论文:Tracing Roots [2604.10480] + DEBUGLM [2603.17884]

3. 业务应用场景

**母婴跨境电商应用**:追踪商品推荐/风控模型的训练数据来源,满足 EU AI Act 等法规审计要求

4. 输入数据要求

请查看原始代码模板获取输入规格。

5. 输出结果

请查看原始代码模板获取输出规格。

6. 业务价值 / ROI

未自动抽取;请查看原始 Skill 卡片。

7. 代码模板

代码块数量:0 · 路径:未检测到

请查看原始 Skill 卡片获取完整代码。

8. 论文来源

  • 2601.14311
  • 2603.17884
  • 2604.10480