Fraud Signal Collection — 欺诈信号数据采集（刷单行为、虚假评论、异常流量）

Skill-Fraud-Signal-Collection · 19-风控反欺诈

experimentmulti_agentdata_collectionfraud_detection广告与投放客服与VOC数据采集与治理MAS与智能体工程风控与合规WF-B 广告优化WF-C 客服分诊WF-D 选品扫描WF-E Review监控

收录于跨境风险防御作战室

年化 ROI48 万

实现难度⭐⭐☆☆☆

业务视角

适用角色运营负责人 / 合规负责人 · 品牌负责人 · CEO

适用平台Amazon 刷评检测与举报 · TikTok Shop 刷单识别 · 竞品 Listing 攻击溯源

什么情况下用竞品刷单刷好评，自己的 BSR 和评分被打压；账号/ASIN 被恶意投诉删除；店铺有异常订单不确定是真实买家

成功是什么样的识别过滤刷评/恶意竞争行为，账号风险提前预警，维权有数据证据，降低封号风险

业务痛点

竞品刷评打压我们我们的好评被恶意举报删除不知道差评是真实的还是恶意的如何证明竞品恶意行为

1. 解决的问题

欺诈检测系统的核心上限由欺诈信号采集的覆盖度和质量决定。母婴电商面临的三类典型欺诈

2. 核心算法逻辑

欺诈检测系统的核心上限由欺诈信号采集的覆盖度和质量决定。母婴电商面临的三类典型欺诈：

3. 业务应用场景

业务背景：品牌 A 的婴儿安全座椅 BSR 被竞品 B 通过刷单超越，损失 Buy Box 和自然流量。需要采集竞品 B 的刷单信号，向 Amazon 品牌保护部门举报，并建立自身防御监控。

行动成果： - 将采集的欺诈信号包（PDF报告 + 原始数据）提交 Amazon 品牌保护 - 竞品 B 的 68 条虚假评论被删除，BSR 下滑 - 品牌 A 恢复 Buy Box，月均 GMV 回升 +¥48 万

业务背景：DTC 独立站发现 Meta 广告 CTR 异常偏高（3.8%，正常 1.2%），但转化率极低（0.03%），怀疑存在大量 Bot 点击消耗广告预算。

4. 输入数据要求

请查看原始代码模板获取输入规格。

5. 输出结果

请查看原始代码模板获取输出规格。

6. 业务价值 / ROI

48 万

7. 代码模板

代码块数量：5 · 路径：未检测到

"""
Fraud Signal Collection Pipeline
整合 FraudGraph-Collect (刷单图特征) + ReviewSignal (虚假评论) + BotTrafficDetect (Bot流量)
使用 mock 数据，可直接运行
"""

import re
import math
import random
import hashlib
import numpy as np
from dataclasses import dataclass, field
from typing import Dict, List, Optional, Tuple, Set
from datetime import datetime, timedelta
from collections import defaultdict


# ── 数据结构 ────────────────────────────────────────────────────────────

@dataclass
class OrderRecord:
    """订单记录"""
    order_id: str
    user_id: str
    device_fp: str       # 设备指纹
    ip_addr: str
    shipping_addr: str   # 标准化收货地址
    order_time: datetime
    review_time: Optional[datetime]  # 评论时间（若有）
    review_text: str
    rating: int


@dataclass
class SessionRecord:
    """会话记录（用于 Bot 检测）"""
    session_id: str
    ip_addr: str
    user_agent: str
    page_view_count: int
    dwell_time_sec: float      # 总停留时间
    mouse_events: int          # 鼠标事件数
    scroll_depth_pct: float    # 滚动深度（0-100%）
    request_interval_cv: float # 请求间隔变异系数
    asn_type: str              # residential / datacenter / vpn


@dataclass
class FraudSignal:
    """欺诈信号汇总"""
    entity_id: str
    entity_type: str            # order / review / session
    fraud_score: float          # 0-1
    fraud_type: str             # order_fraud / fake_review / bot_traffic
    signals: Dict[str, float]   # 各维度信号值
    is_fraud: bool
    confidence: str             # HIGH / MEDIUM / LOW


# ── FraudGraph-Collect：刷单行为特征采集 ────────────────────────────────

8. 论文来源

2406.14891
2409.17234
2501.12847