SKU跨平台实体统一标识与标签同步 — ASIN/SKU/ERP三码合一的实体对齐与标签一致性保障
Skill-SKU-Entity-Unified-ID-Tagging · 24-标签工程
causalexperimentknowledge_graphpricing广告与投放供应链与补货推荐与搜索定价与利润WF-A 智能补货WF-B 广告优化WF-D 选品扫描WF-F 动态定价WF-J DTC 独立站增长WF-L 内容营销增长
收录于标签工程与本体驱动手册
实现难度⭐⭐⭐☆☆
业务视角
适用角色数据架构师 / 供应链数字化负责人 · CTO · 数据工程师 · 供应链团队
什么情况下用多平台数据孤岛导致断货识别延迟8小时;标签覆盖率不足使AI决策触发率<30%;想实现分析→行动自动闭环但不知从何下手
成功是什么样的统一 Tag Schema + 传播引擎将标签覆盖率从 30% 提升至 97%;Palantir 风格 Object-Action-Writeback 将补货响应从 2 天缩短至 4 小时自动触发
业务痛点
1. 解决的问题
运营团队面临"3个平台5套SKU编码数据对不上"——Golden Record三码合一将库存对账从3天人工→实时自动,跨平台标签同步从90分钟→5分钟
2. 核心算法逻辑
跨平台实体统一(CrossPlatform Entity Alignment) 是标签工程的数据基础:在给实体打标签之前,必须确认"这三个不同名字是同一个产品"。
3. 业务应用场景
场景A:多平台库存不一致根因追溯 - 业务问题:Amazon 报告某 SKU 有 200 件库存,但 ERP 只有 180 件,TikTok 系统没有记录,不知道哪个对 - 统一标识方案:确认三个系统的 ID 映射后,追溯差异: - Amazon 200件 = FBA 实物 180件 + 在途 20件(Amazon内部预分配) - ERP 180件 = 已入仓实物 - TikTok = 0件(该平台无独立库存,走 Amazon FBA 发货) - 业务价值:消除库存数据孤岛,统一视图建立后补货决策无争议
**场景B:新品上市跨平台标签同步** - **业务问题**:新款辅食机上市,需要在 Amazon/TikTok/Shopify 三个平台同时打上"新品上市"标签,并确保 14 天后自动更新为"成长期" - **统一标识方案**:一次在 internal_id 打标 → 自动同步到三个平台的标签视图 - **业务价值**:从"3个系统分别操作(各30分钟)"→"1次操作(5分钟)",避免遗漏和不一致
4. 输入数据要求
请查看原始代码模板获取输入规格。
5. 输出结果
请查看原始代码模板获取输出规格。
6. 业务价值 / ROI
- ROI预估:统一标识消除数据孤岛后,库存数据对账从"3天人工"→"实时自动"(节省月均人力成本约5,000元);跨平台标签同步使新品上市操作从"3平台分别操作90分钟"→"一次操作5分钟",年节省约80小时运营时间
- 实施难度:⭐⭐⭐☆☆(主要工作量在初期映射关系建立,一旦建立维护成本低)
- 优先级评分:⭐⭐⭐⭐☆(是所有"跨平台联合分析"的数据基础,没有统一标识,多渠道运营永远是数据孤岛)
- 评估依据:母婴跨境品牌平均在3-5个平台销售,平均每个SKU有2-4个外部ID,统一标识是标签工程的必要前提
7. 代码模板
代码块数量:4 · 路径:未检测到
"""
SKU跨平台实体统一标识与标签同步
功能:多平台ID映射 / 实体对齐 / 标签冲突解决 / 统一标签视图
输入:各平台SKU数据 + 映射规则
输出:Golden Record / 统一ID映射 / 跨平台一致性标签
"""
import numpy as np
import pandas as pd
import hashlib
import re
from dataclasses import dataclass, field
from typing import Optional
import warnings
warnings.filterwarnings('ignore')
@dataclass
class PlatformID:
platform: str
external_id: str
confidence: float = 1.0
match_method: str = "manual" # manual/rule/embedding
@dataclass
class GoldenRecord:
"""黄金记录:跨平台统一实体"""
internal_id: str
canonical_name: str
product_family: str
brand: str
platform_ids: list = field(default_factory=list) # [PlatformID]
unified_tags: dict = field(default_factory=dict) # tag_id → {value, source, confidence}
tag_conflicts: list = field(default_factory=list) # 冲突记录
def add_platform_id(self, platform: str, external_id: str,
confidence: float = 1.0, method: str = "manual"):
self.platform_ids.append(PlatformID(platform, external_id, confidence, method))
def merge_tag(self, tag_id: str, value, source: str, confidence: float,
priority_order: list = None):
"""合并标签(处理冲突)"""
priority_order = priority_order or ["erp", "amazon", "shopify", "tiktok", "manual"]
existing = self.unified_tags.get(tag_id)
if existing is None:
self.unified_tags[tag_id] = {
"value": value, "source": source,
"confidence": confidence, "all_sources": {source: value}
}
else:
# 记录所有来源的值
existing["all_sources"][source] = value
# 检测冲突(值不同)
if existing["value"] != value:
# 按优先级选择
existing_priority = priority_order.index(existing["source"]) \
if existing["source"] in priority_order else 999
new_priority = priority_order.index(source) \8. 论文来源
- 2304.09123
- 2308.07198
- 2402.11834