HGT — 异构图 Transformer 表示学习
Skill-HGT-Heterogeneous-Graph-Transformer · 08-知识图谱
1. 解决的问题
HGT (Heterogeneous Graph Transformer) 解决传统 GNN 无法处理异构图(节点和边有多种类型)的核心问题。传统 GNN 假设所有节点和边共享同一特征分布,这在电商场景(用户/产品/评论/属性共存)中完全不成立。
2. 核心算法逻辑
HGT (Heterogeneous Graph Transformer) 解决传统 GNN 无法处理异构图(节点和边有多种类型)的核心问题。传统 GNN 假设所有节点和边共享同一特征分布,这在电商场景(用户/产品/评论/属性共存)中完全不成立。
3. 业务应用场景
母婴出海电商覆盖多语言市场(英文站、中文站、日文站)。同一产品在不同语言站的描述和评论存在大量语义等价但表述不同的属性(如英文 "portable" = 中文 "便携" = 日文 "持ち運び")。传统方法需要人工维护多语言对齐词典,成本高且难以扩展。
- 多语言产品图: - 节点:product(产品)、attribute_en(英文属性)、attribute_zh(中文属性)、attribute_ja(日文属性) - 边:(product, has_attribute, attribute_)、(attribute_, synonym_of, attribute_*) - 跨语言评论数据:各语言站的评论文本及提取的属性 - 产品基础信息:品牌、品类、价格带
业务价值: - 新语言站点上线周期从 2-3 个月缩短至 2 周 - 无需人工维护多语言词典,节省翻译/标注成本 60%+ - 支持小语种市场(如阿拉伯语、泰语)快速扩展
4. 输入数据要求
请查看原始代码模板获取输入规格。
5. 输出结果
请查看原始代码模板获取输出规格。
6. 业务价值 / ROI
- 数据要求:需要构建完整的异构图(多类型节点+边),数据工程量大
- 技术门槛:较高,需理解 meta relation、异构注意力、图采样
- 工程复杂度:中高,PyTorch Geometric 异构图 API 有学习曲线
- 维护成本:中,图结构变化需重新训练或增量更新
- 业务价值高:跨语言对齐和冷启动是出海电商核心痛点
- 技术前沿性:HGT 是异构表示学习的 SOTA 基础,WWW 2020 后大量后续工作
7. 代码模板
代码块数量:7 · 路径:未检测到
cd paper2skills-code/knowledge_graph/hgt_ecommerce
pip install torch torch_geometric
python hgt_model.py
8. 论文来源
未自动抽取;请查看原始 Skill 卡片。