paper2skills Playbook

TRACE 跨会话点击流用户嵌入

Skill-TRACE-Clickstream-Embedding · 14-用户分析

causalexperimentforecastingoptimizationrecommendation广告与投放供应链与补货客服与VOC推荐与搜索WF-A 智能补货WF-B 广告优化WF-C 客服分诊WF-D 选品扫描WF-E Review监控WF-H 复购增长
年化 ROI10 万
实现难度⭐⭐⭐☆☆
业务优先级⭐⭐⭐⭐☆
业务视角
适用角色运营负责人 / 用户增长负责人 · CMO · 产品经理
适用平台Amazon 买家分层 · DTC 站 LTV 预测 · Klaviyo/Brevo 邮件分群
什么情况下用有大量老客户,但不知道谁是高价值客户、谁快要流失;新客获取成本越来越高,老客复购却上不去
成功是什么样的用户按 RFM/LTV 分层精准触达,高价值用户留存率提升,老客贡献收入占比从 30% 提升到 50%
业务痛点
老客复购率上不去不知道哪些用户要流失了所有用户用同一套活动买过一次就不见了

1. 解决的问题

传统序列推荐模型只看单会话内的商品点击序列,TRACE 的创新在于:把整个用户的多会话页面浏览历史(包括首页、搜索页、详情页、购物车、结账等各类页面,跨越数天甚至数周)打包成一条有序序列,送入轻量级 Transformer Encoder 学习全局用户状态嵌入。

2. 核心算法逻辑

传统序列推荐模型只看单会话内的商品点击序列,TRACE 的创新在于:把整个用户的多会话页面浏览历史(包括首页、搜索页、详情页、购物车、结账等各类页面,跨越数天甚至数周)打包成一条有序序列,送入轻量级 Transformer Encoder 学习全局用户状态嵌入。

3. 业务应用场景

业务问题: 母婴出海跨境独立站(如婴儿推车、有机奶粉、儿童安全座椅品类)面临典型问题:用户决策周期长(备孕→孕期→育儿长达数年),单次会话转化率极低(通常 <1%),但通过多次访问才能判断哪些用户真正处于购买决策阶段。

具体痛点: - 无法区分"随机浏览的新妈妈"与"已在比价、即将下单的精准用户" - 首页、分类页、评测博客页的访问比例不明,无法调整流量引导策略 - 跨境物流页(Shipping Policy)和信任背书页(Certifications)的浏览顺序是否预示转化,缺乏数据支持 - 再营销广告投放预算有限,只能定向给高意图用户,但无法识别

| 字段 | 类型 | 示例 | |------|------|------| | user_id | string | "usr_abc123" | | session_id | string | "sess_2026042001" | | page_name | category | "homepage" / "product_detail" / "cart" / "checkout" / "blog_stroller_review" / "shipping_policy" | | device_type | category | "mobile" / "desktop" / "table

4. 输入数据要求

请查看原始代码模板获取输入规格。

5. 输出结果

请查看原始代码模板获取输出规格。

6. 业务价值 / ROI

10 万

7. 代码模板

代码块数量:3 · 路径:未检测到

"""
TRACE 母婴电商点击流用户嵌入实现
arXiv: 2409.12972

环境依赖: pip install torch numpy scikit-learn matplotlib
可选依赖: pip install seaborn  # 更美观的可视化
"""

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import Dataset, DataLoader
import numpy as np
from sklearn.manifold import TSNE
from sklearn.decomposition import PCA
from sklearn.preprocessing import LabelEncoder
from typing import List, Dict, Tuple
import random
import math

# ─────────────────────────────────────────────
# 1. 模拟母婴电商点击流数据生成
# ─────────────────────────────────────────────

# 母婴 DTC 站点页面类型
PAGE_NAMES = [
    "homepage",           # 首页
    "category_stroller",  # 品类页:婴儿推车
    "category_formula",   # 品类页:奶粉
    "category_carseat",   # 品类页:安全座椅
    "product_detail",     # 商品详情页(PDP)
    "blog_review",        # 博客/评测页
    "search_results",     # 搜索结果页(SRP)
    "cart",               # 购物车
    "checkout",           # 结账页
    "order_confirmation", # 订单确认页
    "shipping_policy",    # 配送政策页
    "certifications",     # 认证信任背书页
    "my_orders",          # 我的订单(VUO)
    "wishlist",           # 收藏夹
]

DEVICE_TYPES = ["mobile", "desktop", "tablet"]
UTM_SOURCES = ["instagram", "google", "organic", "email", "tiktok"]

# 购买漏斗阶段 → 影响页面访问概率
USER_STAGE_PROBS = {
    "explorer": {  # 探索期:大量浏览,不太购买
        "homepage": 0.20, "category_stroller": 0.15, "category_formula": 0.10,
        "category_carseat": 0.10, "product_detail": 0.15, "blog_review": 0.15,
        "search_results": 0.08, "cart": 0.03, "checkout": 0.01, 
        "order_confirmation": 0.00, "shipping_policy": 0.01, "certifications": 0.01,
        "my_orders": 0.00, "wishlist": 0.01,
    },
    "evaluator": {  # 比较期:聚焦商品详情、评测
        "homepage": 0.05, "category_stroller": 0.08, "category_formula": 0.05,
        "category_carseat": 0.05, "product_detail": 0.30, "blog_review": 0.20,
        "search_results": 0.12, "cart": 0.08, "checkout": 0.03,
        "order_confirmation": 0.00, "shipping_policy": 0.02, "certifications": 0.01,
        "my_orders": 0.00, "wishlist": 0.01,

8. 论文来源

  • 2409.12972