causalexperimentforecastingoptimizationpricing广告与投放定价与利润

02-A_B实验

Thompson Sampling是一种基于贝叶斯后验采样的在线决策算法，用于解决探索-利用权衡（Exploration-Exploitation Tradeoff）问题。算法的核心洞见是：按照每个动作是最优动作的概率来选择动作，而非简单地选择当前估计奖励最高的动作。

experimentoptimizationrecommendation广告与投放推荐与搜索

因果时间序列预测 - GCF 反事实需求建模

03-时间序列

平台在大促期对核心母婴 SKU(纸尿裤、婴儿车)做搜索权重提升 + 首页 Banner 曝光,需要回答"如果没做促销,需求应该是多少"——避免把自然增长功劳归到促销 - 数据要求:全品类销量历史 + 促销标记 + 商品图谱(同类竞品关系) - GCF 配置:节点=SKU,边=同品类竞品,干预=促销曝光,合成控制=未受促销的同类 - 业务价值:促销 ROI 计算精度提升 30-50%,避免

50-100 万元⭐⭐⭐⭐☆

causalexperimentforecastingknowledge_graphmulti_agent广告与投放供应链与补货知识图谱与RAGMAS与智能体工程

Conformal Prediction Demand UQ（需求预测不确定性量化）

03-时间序列

传统需求预测只给点估计（"下月卖 1000 件"），业务需要区间估计（"95% 置信区间: 850-1200 件"）。Conformal Prediction 提供分布无关的、有限样本有效的预测区间，无需假设误差分布。

30-50 万元⭐⭐☆☆☆

causalexperimentforecastingrag供应链与补货知识图谱与RAG

为什么传统归因不够：瀑布式逻辑（"缺货→往上查库存→往上查采购"）本质上是相关性分析，无法区分"A 导致 B"与"C 同时导致 A 和 B"。实际供应链中，多因素常常通过间接路径（中介变量）影响结果——比如"需求预测误差→战术产能调整→Capped Out Hours（COH）"，传统归因会错误地把间接效应归给直接可见的变量。

5-10 万元⭐⭐⭐⭐☆

causalexperimentforecastingoptimizationfraud_detection广告与投放供应链与补货

监测到"wearable breast pump"（穿戴式吸奶器）谷歌搜索量过去 6 个月增长 180%（$p<0.01$），BSR 上升 45%，TikTok 话题 #wearablepump 播放量 2.3 亿

50-100 万元⭐⭐☆☆☆

experimentforecasting广告与投放供应链与补货推荐与搜索

Multimodal RAG（多模态检索增强生成）将 RAG 系统从纯文本扩展到图文混合模态，实现

causalexperimentragknowledge_graphvisual_generation客服与VOC推荐与搜索知识图谱与RAG视觉内容生成

领域 Ontology 与图谱 Schema 设计

08-知识图谱

知识图谱的 Schema（本体 / Ontology）是整个 KG 的"地图"——它定义了有哪些实体类型、有哪些关系、每个属性的值域和约束。Schema 质量直接决定下游 KGQA 的检索上限和 GraphRAG 的推理深度。母婴电商领域 Ontology 设计需要平衡覆盖率（覆盖所有业务场景）与可管理性（避免过度细化导致维护失控）。

causalexperimentragknowledge_graphpricing客服与VOC知识图谱与RAG定价与利润

检索后精排 — Cross-Encoder Reranking

08-知识图谱

RAG 管道的检索阶段（BM25/向量检索）优先保证召回率，会返回大量候选文档（top-50~100）。但这些候选文档与查询的相关性排序往往不准——召回阶段的 Bi-encoder 是独立编码查询和文档，无法捕捉两者间的细粒度交互。

28 万

causalexperimentoptimizationrecommendationragknowledge_graphmulti_agent客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程

10-MAS

1. 性能坍塌问题：新 Agent 加入时，系统路由还不了解其能力，导致任务分配混乱、性能下降

⭐⭐⭐☆☆

experimentoptimizationmulti_agent广告与投放供应链与补货客服与VOCMAS与智能体工程风控与合规

MAS Testing & Verification — 多智能体系统测试验证：覆盖制导 Fuzzing + 跨框架可观测性

10-MAS

MAS 的失败模式与单体软件完全不同：Agent 之间的交互是非确定性的，工具调用可能失败，Agent 可能陷入死循环，而这些问题用传统单元测试根本无法发现。MAS 专用测试体系需要解决三个独特问题

causalexperimentragmulti_agent广告与投放供应链与补货客服与VOC知识图谱与RAGMAS与智能体工程风控与合规

MASEval — 系统级 MAS 评估：Framework 影响与模型影响同等重要

10-MAS

传统 MAS 评估聚焦模型级（Model-Level）：固定 framework，换 LLM 比性能差异。MASEval 提出系统级（System-Level）评估范式，将完整 MAS 系统（模型 × Framework × 协调逻辑）作为原子评测单元，形成 3×3×3 全因子实验设计：3 个 LLM backbone × 3 个 Agent Framework（smolagents/LlamaIndex/AutoGen 等）× 3 种协调逻辑（顺序/并行/自适应）。

20-60 万⭐⭐☆☆☆

causalexperimentoptimizationrecommendationmulti_agent供应链与补货推荐与搜索MAS与智能体工程

MetaGPT — SOP 驱动的多智能体协作框架

10-MAS

MetaGPT 将人类组织中的 Standardized Operating Procedures（SOP，标准作业程序）引入多 agent 协作。核心洞察：复杂任务失败的主要原因是 agent 间缺乏标准化协作规范和结构化信息传递。通过模拟软件公司的角色分工（PM → Architect → Engineer → QA）和文档驱动的工作流，MetaGPT 显著减少了多 agent 协作中的幻觉和级联错误。

⭐⭐⭐⭐☆

causalexperimentragmulti_agentdata_collectionpricing客服与VOC知识图谱与RAG数据采集与治理MAS与智能体工程定价与利润

Multi-Agent Debate — 多智能体辩论共识

10-MAS

- LLM 生成初始答案后，即使答案错误，也会在后续反思中"维护"这个答案

⭐⭐⭐☆☆

causalexperimentoptimizationrecommendationragmulti_agentpricing客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润

ParaManager — 小模型主编排：Agent-as-Tool 并行子任务分解

10-MAS

Agent-as-Tool 协议统一：ParaManager 将传统系统中异构的 Agent（具有内部状态、多轮推理能力）和 Tool（无状态函数调用）统一为标准化的 `AgentAsTool` 接口。每个动作单元暴露相同的 `invoke(input) -> result` 接口，同时携带显式状态反馈（`status`, `progress`, `output`），让编排器无需了解底层实现差异即可统一调度。

⭐⭐☆☆☆

causalexperimentforecastingoptimizationknowledge_graphmulti_agentpricingvisual_generation广告与投放供应链与补货推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润风控与合规视觉内容生成

ReAct — 推理与行动交替执行

10-MAS

ReAct (Reasoning + Acting) 提出了一种推理与行动交织的范式。核心洞察：纯推理（Chain-of-Thought）容易幻觉，纯行动（Tool Use）缺乏规划——只有把两者交替进行，才能既保持思维连贯性又确保信息准确性。

⭐⭐⭐☆☆

causalexperimentmulti_agentpricing广告与投放客服与VOC推荐与搜索MAS与智能体工程定价与利润

Reflexion — 言语强化学习与自我反思

10-MAS

Reflexion 提出了一种言语强化学习（Verbal Reinforcement Learning）机制。核心洞察：传统 RL 需要更新模型权重，成本高且难以解释；而 LLM 可以通过自然语言形式的"自我反思"来改进策略，无需任何权重更新。

⭐⭐⭐⭐☆

causalexperimentoptimizationmulti_agentpricing供应链与补货客服与VOCMAS与智能体工程定价与利润

SDOF — 状态机约束 MAS 编排：屏蔽非法操作，任务完成率 86.5%

10-MAS

SDOF 将 Multi-Agent System（MAS）的执行流程建模为有限状态机（FSM），通过双层防护机制确保 Agent 行为的合法性。

⭐⭐⭐☆☆

causalexperimentforecastingoptimizationmulti_agent广告与投放供应链与补货MAS与智能体工程风控与合规

Self-Refine + RL — 反馈闭环与自进化 Agent

10-MAS

Self-Refine 是一种让 Agent 对自身输出进行批评和改进的迭代机制。核心洞察：语言模型不仅能生成内容，也能评估和改进内容——利用同一模型的双重能力，实现无需外部监督的自我进化。

⭐⭐⭐⭐☆

causalexperimentoptimizationmulti_agent客服与VOC数据采集与治理MAS与智能体工程

Skill Registry — 技能注册表与动态发现

10-MAS

Skill Registry 是 MAS 工作流的核心基础设施，负责管理所有可用技能的元数据、依赖关系和运行时状态。核心洞察：一个可扩展的多 Agent 系统必须能动态发现、加载和组合技能，而不是硬编码固定流程。

⭐⭐⭐☆☆

experimentmulti_agent客服与VOC数据采集与治理MAS与智能体工程

Subagent Decomposer — 复杂任务子智能体分解

10-MAS

Subagent Decomposer 负责将复杂的 Task Blueprint 分解为可独立执行的子任务，并分配给专门的子 Agent。核心洞察：复杂任务（如"生成全品类 VOC 周报"）无法由单个 Agent 高效完成，必须分解为并行/串行的子任务，每个子任务由最优技能的子 Agent 执行。

36万⭐⭐⭐⭐☆

experimentrecommendationmulti_agentpricing客服与VOC推荐与搜索MAS与智能体工程定价与利润

Tree of Thoughts — 树搜索式任务规划

10-MAS

Tree of Thoughts (ToT) 将 LLM 的推理过程从线性链式思维（Chain-of-Thought）扩展为树状搜索。核心洞察：人类解决复杂问题时会探索多条路径、评估中间进展、在死胡同回溯——LLM 也应该具备这种"深思熟虑"的能力。

⭐⭐⭐⭐☆

causalexperimentoptimizationrecommendationmulti_agentpricing客服与VOC推荐与搜索MAS与智能体工程定价与利润

AI Brand Storytelling — AI 辅助品牌故事创作：情感连接与文化适应

11-AI人文

钩子（Hook） → 冲突（Conflict） → 解决（Resolution） → 行动召唤（CTA）

⭐⭐☆☆☆

causalexperimentoptimization广告与投放客服与VOC推荐与搜索数据采集与治理风控与合规

AI Consumer Wellbeing Ethics — 消费者福祉与 AI 伦理：母婴场景

11-AI人文

AI 系统必须在用户可感知的层面说明"你在和一个 AI 交互"。FTC 2023 年指南明确要求：AI 客服首条消息必须声明身份；AI 生成内容必须标注。母婴场景额外要求：当 AI 给出健康/营养建议时，必须附注"请咨询儿科医生"。

⭐⭐☆☆☆

experimentrecommendationmulti_agent广告与投放供应链与补货客服与VOC推荐与搜索MAS与智能体工程风控与合规

AI Explainability for Consumer Trust — AI 推荐可解释性：消费者信任构建

11-AI人文

母婴高风险购买决策（奶粉品牌、安全座椅、辅食选择）的特点是：消费者需要理由才能信任推荐。研究表明，在高风险品类中，"不知道为什么推荐"比"不推荐"更会降低购买意愿。黑盒 AI 推荐的三个信任障碍

⭐⭐☆☆☆

causalexperimentrecommendationmulti_agentfraud_detectionpricing广告与投放推荐与搜索MAS与智能体工程定价与利润风控与合规

AI技术概念 × 疗愈哲理金句卡片库

11-AI人文

本卡片采用 LoRA + Prompt Tuning 跨模态迁移范式，将 AI 技术概念通过类比映射转化为人文疗愈语言。

⭐☆☆☆☆

experimentoptimizationrecommendation推荐与搜索

AIGC Content Detection — AI生成内容鉴别：母婴评论真实性保护

11-AI人文

AI 生成文本与人类写作在统计层面存在系统性差异，可通过以下三类特征加以量化鉴别

⭐⭐☆☆☆

experimentforecastingmulti_agentfraud_detection供应链与补货客服与VOCMAS与智能体工程风控与合规

Cultural Data Collection — 跨文化 UGC 采集与母婴消费文化差异识别

11-AI人文

文化语境的不可迁移性——相同语义在不同文化中承载截然不同的消费偏好信号。

280 万⭐⭐⭐☆☆

causalexperimentrecommendationdata_collectionpricing供应链与补货客服与VOC推荐与搜索数据采集与治理MAS与智能体工程定价与利润

Emotional AI Customer Care — 情感感知客服：高压场景的同理心 AI

11-AI人文

情绪识别：通过关键词匹配（域内词典）+ 句式特征（连续感叹号、全大写）识别用户情绪状态，将其分级为 CALM / ANXIOUS / FRUSTRATED / ANGRY / FRIGHTENED 五档。母婴高压场景（安全召回、产品危害）优先触发 FRIGHTENED 级别，绕过普通情绪判断逻辑。

⭐⭐☆☆☆

causalexperimentforecastingmulti_agentdata_collectionpricing广告与投放供应链与补货客服与VOC数据采集与治理MAS与智能体工程定价与利润

Cross-Validation Strategies（交叉验证策略）

12-ML基础

交叉验证解决"模型在未知数据上表现如何"的问题——不是依赖一次 train/test split 的"运气"，而是通过多次切分平均来获得稳健的泛化能力估计。

3-5 万⭐⭐☆☆☆

forecasting供应链与补货推荐与搜索MAS与智能体工程

Skill-Data-Drift-Detection

12-ML基础

核心思想：生产 ML 模型上线后，输入数据的分布会随时间偏移（用户行为变化、季节性、竞品冲击），导致模型悄然失效。数据漂移检测通过持续监控特征分布（统计漂移）和预测误差（性能漂移）两条并行轨道，在模型失效前触发告警和重训——区别于异常检测，漂移检测关注的是系统性、持续性的分布偏移，而非偶发性异常点。

⭐⭐☆☆☆

causalexperimentforecastingrecommendationpricing广告与投放供应链与补货客服与VOC推荐与搜索定价与利润

Embedding Fundamentals — 嵌入表示学习基础：从 ID 映射到多模态语义对齐

12-ML基础

跨境平台上架 50 款新款婴儿车，无任何历史购买数据，纯 ID 嵌入无法初始化，导致新品在推荐系统中几乎不曝光（冷启动问题）

15-50 万元⭐⭐⭐☆☆

causalexperimentrecommendationmulti_agentpricingvisual_generation供应链与补货推荐与搜索MAS与智能体工程定价与利润视觉内容生成

Ensemble Methods（集成学习方法）

12-ML基础

单独用 XGBoost 预测流失 AUC=0.82，单独用 LightGBM AUC=0.81，单独用 Random Forest AUC=0.78

40-80 万元⭐⭐⭐☆☆

forecasting广告与投放MAS与智能体工程

Feature Engineering for E-Commerce Machine Learning

12-ML基础

核心问题：模型效果的上限由特征质量决定。同样的算法，好的特征 vs 差的特征，效果可能差3-5倍。特征工程是"把领域知识注入模型的艺术"。

⭐⭐⭐☆☆

causalexperimentforecastingrecommendationmulti_agentpricing客服与VOC推荐与搜索MAS与智能体工程定价与利润

Feature Selection（特征选择）

12-ML基础

我们从多个数据源（CRM、广告平台、网站分析、客服系统）汇总了 200+ 特征

30-60 万元⭐⭐⭐⭐☆

causalexperimentforecastingoptimizationdata_collection广告与投放客服与VOC数据采集与治理MAS与智能体工程

Hyperparameter Optimization（超参调优）

12-ML基础

默认参数的 XGBoost 流失预测 AUC=0.78，希望通过超参调优提升到 0.82+

50-100 万元⭐⭐⭐☆☆

causalexperimentforecastingoptimizationrecommendation广告与投放推荐与搜索MAS与智能体工程

Imbalanced Data Handling（不平衡数据处理）

12-ML基础

流失率 5%，直接用 XGBoost 训练，Recall 只有 0.3——70% 的流失用户没被识别

150-300 万元⭐⭐☆☆☆

causalforecasting广告与投放MAS与智能体工程

Model Evaluation Metrics（模型评估体系）

12-ML基础

模型评估体系解决"模型到底好不好"这个问题——不是凭感觉，而是用标准化的量化指标从多个维度衡量模型表现。这是所有预测建模的基础能力，也是 ML 工程中模型选型、A/B 测试结果判读、生产监控的必备技能。

5-8 万⭐⭐☆☆☆

causalexperimentforecastingrag广告与投放供应链与补货知识图谱与RAGMAS与智能体工程

Skill-Model-Performance-Monitor

12-ML基础

核心思想：数据漂移检测（Skill-Data-Drift-Detection）解决的是"输入变了吗"，模型性能监控解决的是"输出还准吗"。两者共同构成生产 ML 模型的完整健康体系。性能监控通过滑动窗口持续评估 AUC/MAPE 等指标，配合 Shadow Mode（新模型静默跑）和 Champion-Challenger（A/B 对比）两种灰度部署模式，在不影响生产的前提下验证新版本并安全切换。

⭐⭐☆☆☆

causalexperimentforecastingrecommendation供应链与补货推荐与搜索

Supply Chain ML Feature Engineering — 供应链 ML 特征工程：时序+图+统计三维

12-ML基础

1. 稀疏性：长尾 SKU 历史销量不足（< 30 天），传统特征工程无法直接应用

供应链 ML 模型准确率提升 15-20%，减少缺货/积压成本⭐⭐☆☆☆

causalexperimentforecasting广告与投放供应链与补货

Multi-Touch Attribution Modeling for Digital Advertising

13-广告分析

用户从第一次看到广告到最终下单，平均接触5-7个触点（Facebook视频、Google搜索、TikTok短视频、再营销广告、邮件）。

10万⭐⭐⭐☆☆

causalexperiment广告与投放MAS与智能体工程

Ad-to-Behavior Funnel（广告→用户行为漏斗）

13-广告分析

FB 吸奶器广告点击后：35% 进详情页 → 12% 加购 → 5% 首购 → 2% 复购

15-25 万元⭐⭐☆☆☆

forecastingoptimization广告与投放供应链与补货推荐与搜索

Amazon ToS Compliance Guardrail（亚马逊合规护栏）

13-广告分析

LLM 在生成商品文案、广告文案、客服回复时可能无意间违反平台规则（医疗声明、安全认证、受限品类）。Compliance Guardrail 在 LLM 输出端建立三层过滤——从确定性规则匹配到风险评分到人工升级——确保所有面向亚马逊的内容合规。

5-10 万⭐⭐☆☆☆

causalexperimentrecommendationragmulti_agentfraud_detectionpricing广告与投放客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润风控与合规

Click A Buy B 跨品类归因去偏 - 点击与购买商品不一致的归因修正

13-广告分析

用户点击吸奶器广告，进入品牌店铺后转而购买了储奶袋和奶瓶

100 万元⭐⭐⭐☆☆

causalexperimentforecastingoptimizationrecommendationragknowledge_graph广告与投放推荐与搜索知识图谱与RAG

CDA（Causal-Driven Attribution）— 无用户级数据的因果驱动归因

13-广告分析

核心思想：仅用聚合级别的每日广告曝光量与总订单数，无需任何 User ID 或 Cookie 追踪数据，通过时序因果图谱量化各渠道对转化的真实贡献比例。

⭐⭐☆☆☆

causalexperimentoptimizationrecommendationragmulti_agent广告与投放推荐与搜索知识图谱与RAGMAS与智能体工程

Creative Fatigue Detection — 生存分析驱动的广告素材疲劳检测

13-广告分析

广告素材疲劳（Creative Fatigue）是指：同一批用户反复看到相同广告后，CTR、CVR 等核心指标持续衰减的现象。

⭐☆☆☆☆

causalexperimentforecasting广告与投放

ALM-MTA 前门因果多触点归因 - 剔除隐藏混淆的广告真实 ROI 剥离

13-广告分析

孕晚期用户购买周期 6-8 周，在"下定决心买推车"后主动搜索并点击所有重定向短信/DPA 广告

150-300 万元⭐⭐⭐☆☆

causalexperimentforecastingoptimization广告与投放供应链与补货

图基跨设备追踪 - 无监督IP-Domain图谱用户拼接

13-广告分析

母婴用户在 TikTok 看到吸奶器短视频种草，切换到 Safari 搜索品牌名进独立站下单

600-1200 万元⭐⭐☆☆☆

causalexperiment广告与投放

层次图神经网络跨设备用户匹配 - 无ID的跨端行为拼接

13-广告分析

将每台设备的 URL 访问序列 $\mathcal{S}_v = \{s_1, s_2, \ldots, s_n\}$ 构建为层次异构图

⭐⭐⭐⭐☆⭐⭐⭐☆☆

causalexperimentragmulti_agentvisual_generation广告与投放客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程风控与合规视觉内容生成

HMMCB — 跨渠道广告竞价 MARL：CPC 约束下最大化总点击（美团真实 A/B）

13-广告分析

母婴 DTC 品牌（如储奶袋/吸奶器）同时在 Google Ads（搜索意图强）、Meta（品牌认知+再营销）、TikTok Shop（内容种草+购买）三个渠道投放

500 万⭐⭐⭐⭐☆

causalexperimentoptimizationmulti_agentpricing广告与投放MAS与智能体工程定价与利润

电商搜索层次化意图分类 - 母婴跨境广告自动词分类

13-广告分析

WF-B 广告优化的核心是"自动词拉取质量"——母婴搜索词意图复杂(月龄敏感/信息查询/购买意图),错分会导致广告全链路失效. 本论文用两层意图分类:① Label Hierarchy(标签图 GCN + 注意力)让 fine-grained 子类感知父类约束;② Instance Hierarchy(对比学习负对)区分同父类不同子类的查询;③ Neighborhood-aware Sampling(自训练)解决少数类(敏感词 0.05%-0.15%)冷启动. 在 Amazon 真实搜索数据上超

800-1000 万元⭐⭐⭐⭐☆

causalexperimentoptimizationmulti_agent广告与投放推荐与搜索MAS与智能体工程

Identity Fragmentation Debiasing（身份碎片化纠偏）

13-广告分析

核心思想：用户在多设备间切换（手机看广告、电脑下单）导致底层 Cookie/IDFA 无法跨端串联，同一真实用户被拆分为多个"碎片化身份"。这使得广告平台看到的 ROAS 严重失真——有的记录"只有曝光没有购买"，有的记录"只有购买没有广告"。算法通过 Stratified Aggregation（分层聚合）在 Cohort 层面重建真实曝光与购买的对应关系，无需跨设备图谱，还原因果 ROI。

⭐⭐☆☆☆

causalexperimentoptimizationrag广告与投放知识图谱与RAG风控与合规

Amazon Listing 文案 AI 生成（标题+Bullet+描述全套）

13-广告分析

某母婴品牌每月新品 8-12 个 SKU，人工撰写一套完整 Listing（标题+5条Bullet+描述+后台ST）需要 2-3 小时/SKU，月均耗时 20-30 小时

18-192 万元⭐⭐☆☆☆

causalexperimentforecastingoptimization广告与投放客服与VOC数据采集与治理风控与合规

Skill-Listing-Quality-Scoring

13-广告分析

核心思想：把 Amazon Listing 的「吸引力」分解为文本质量 + 图像质量两个可量化维度，用神经网络预测每个内容位置（标题/主图/描述/bullet points）对转化成功率的贡献，并反向输出"改哪里能提升最多"的可操作建议。

⭐⭐☆☆☆

experimentforecastingoptimizationrecommendationpricingvisual_generation广告与投放客服与VOC推荐与搜索数据采集与治理定价与利润风控与合规视觉内容生成

Negative Keyword Safe Guard — 贝叶斯小样本负关键词安全过滤

13-广告分析

母婴品类广告投放中，自动化广告（Auto Campaign）会将产品匹配到大量搜索词。

$432（18% → 3.2%无关消耗）⭐☆☆☆☆

causalexperimentoptimizationrecommendation广告与投放推荐与搜索数据采集与治理

PIE 实验增量预测多触点归因 - Amazon MTA 框架落地

13-广告分析

Momcozy / Graco 等大牌同投 Google Search + Facebook DPA + TikTok Shop

200 万⭐⭐⭐☆☆

causalexperimentforecastingrecommendation广告与投放推荐与搜索

PVM 跨平台广告归因窗口统一化 - 母婴跨境多渠道 ROAS 去偏

13-广告分析

WF-B 跨渠道归因痛点:Amazon 14d-click、Meta 7d-click、TikTok 7d-click 归因窗口不一致,Last-Click Mechanism (LCM) 让平台策略性延迟上报点击时间抢归因信用,LCM 不满足 DSIC (Dominant Strategy Incentive Compatible),准确率最低可趋近于 0. PVM (Peer-Validated Mechanism) 让每个平台的归因信用仅依赖其他平台的报告而非自身,消除策略操控动机,理论最

480 万/年⭐⭐⭐☆☆

causalexperimentoptimizationmulti_agent广告与投放MAS与智能体工程

ROAS Optimization and Ad Budget Allocation

13-广告分析

广告预算有限，如何在不同渠道（Facebook/Google/TikTok）、不同 campaign、不同受众之间分配，使总ROAS（广告支出回报率）最大化？

50万⭐⭐⭐☆☆

causalexperimentforecastingoptimization广告与投放定价与利润

级联延迟净转化建模 - 扣除退款的真实转化桑基图

13-广告分析

传统 CVR（转化率）模型只建模"点击→购买"，忽略退款行为，导致

100 万⭐⭐⭐☆☆

causalexperimentforecastingoptimizationrecommendationpricing广告与投放推荐与搜索定价与利润风控与合规

轨迹条件延迟转化建模 - 不等归因窗口即可实时更新CVR

13-广告分析

给未揭示样本强行打硬标签：未转化样本强标为负样本，引入严重偏差

50 万⭐⭐⭐☆☆

causalexperimentforecasting广告与投放推荐与搜索

TikTok Shop Content Attribution — 短视频带货兴趣图谱归因

13-广告分析

TikTok Shop 的归因困境与传统广告归因有本质差异

⭐⭐⭐☆☆

causalexperimentrecommendationpricingvisual_generation广告与投放推荐与搜索数据采集与治理定价与利润视觉内容生成

AGRS 属性引导评论摘要 - 大规模零幻觉 Review 摘要 pipeline

14-用户分析

传统 LLM 摘要"无约束自由生成"产生幻觉(摘要包含评论中不存在的属性). AGRS 把摘要任务结构化:ABSA 提取 aspect-sentiment → canonical 归一化 → 代表性评论加权采样 → 结构化 prompt 引导 LLM 生成. 100% 基于真实评论,根本规避幻觉. 4 阶段 pipeline 端到端可扩展到百万产品.

1.5 万/月⭐⭐⭐☆☆

causalexperimentpricing供应链与补货客服与VOC数据采集与治理定价与利润

块缺失数据补全 - 整段流量数据丢失时的恢复

14-用户分析

块缺失（Block-wise Missing）的独特挑战：当一整段时间（如连续3天）或一个完整维度（如某渠道所有数据）缺失时，传统插值方法（线性插值、KNN、MICE）依赖"相邻元素"做预测，在块缺失场景下这些邻居全部不存在，方法直接失效。

⭐⭐⭐☆☆

causalexperimentforecastingoptimizationrecommendation广告与投放推荐与搜索

Cohort Retention Analysis for User Lifecycle

14-用户分析

核心问题：新用户来了之后，第7天还剩多少？第30天呢？第90天呢？不同月份来的用户，留存曲线一样吗？Cohort分析把用户按"首次活跃时间"分组，追踪每组的留存轨迹。

⭐⭐☆☆☆

causalexperimentforecastingoptimizationmulti_agent广告与投放MAS与智能体工程

GPLR 用户人群标签生成 - 购买行为到可解释 Persona 的低成本桥接

14-用户分析

用户购买行为包含丰富的人群信号，但直接为百万用户调用 LLM 标注成本极高。GPLR 解决这个矛盾：用少量 LLM 标注 + 图结构传播覆盖全量用户。三步流程：① Diversity-Uncertainty（DU）采样选出最有代表性的"原型用户"做 LLM 标注；② LLM 基于购买历史为原型用户赋予 Persona 标签；③ 在用户-产品交互图上随机游走，将标签从有标注用户传播至全量未标注用户。

10 万⭐⭐☆☆☆

causalexperimentrecommendationpricing广告与投放客服与VOC推荐与搜索定价与利润

LACA 跨语言 ABSA - LLM 数据增强多语种情感分析

14-用户分析

Momcozy 在德/法/西市场每月接收 5000+ 母语客服工单(如德语 "Die Verpackung ist sehr schwer zu öffnen"). 传统做法用 Google Translate 翻译成英文后跑英文 ABSA,翻译会丢失 aspect 对齐("Verpackung" → "package" 时 BIO 边界错位 30%+). 跨境品牌每月因机翻错误导致工单

300-600 万元⭐⭐⭐⭐☆

causalexperimentforecastingpricing客服与VOC推荐与搜索数据采集与治理MAS与智能体工程定价与利润

MAA 多 Agent 行动建议 - 从评论到产品改进决策链

14-用户分析

Momcozy M5 吸奶器在美国/德国/中国三市场销售,各市场用户痛点完全不同(美国关注续航便携、德国关注静音认证、中国关注清洗方便). 现有运营复盘只产出"差评列表",无法直接驱动产品改进决策——产品经理拿到差评列表还要花 1-2 周二次提炼 - 数据要求:三市场 Amazon Review API + market 标签 - MAA 配置: - 按市场分别聚类(K=5,每市场 5

510-920 万元/年⭐⭐⭐⭐☆

causalexperimentrecommendationmulti_agentpricing广告与投放客服与VOC推荐与搜索数据采集与治理MAS与智能体工程定价与利润

Multilingual Customer Service Translation — 多语言客服自动翻译与情绪感知保全

14-用户分析

母婴出海电商的客服场景中，买家使用西班牙语、德语、日语等多语言发起售后投诉，直接机器翻译存在两大失真

⭐⭐⭐☆☆

causalexperimentmulti_agent客服与VOCMAS与智能体工程定价与利润

非商品页路径建模 - 导航页在用户旅程中的转化贡献

14-用户分析

母婴独立站（如 Momcozy/Graco 品牌站）的首页、分类页（奶瓶/奶粉/童车）、搜索页在转化漏斗中起什么作用

5000 万⭐⭐⭐☆☆

causalexperimentforecastingoptimizationrecommendation推荐与搜索

PersonaBot RAG画像生成 - LLM+RAG驱动的客户画像落地工具

14-用户分析

Momcozy 在 Amazon US 的 S9/S12 系列累积数万条评论，但产品团队只能依赖人工抽查了解用户诉求，无法识别"职场背奶妈妈"与"新手妈妈"在痛点上的差异，导致广告文案和详情页对所有人说同样的话，转化率损耗严重 - 数据要求： - Amazon Review 数据（user_id、product_id、评论文本、评分、时间戳），CSV 格式 - 数量：每 SKU ≥ 50

20-40 万元⭐⭐☆☆☆

causalexperimentrag广告与投放客服与VOC推荐与搜索知识图谱与RAG

Personalized Promotion Targeting — 个性化促销定向：用户响应异质性建模

14-用户分析

1. Cannibalization（自相残杀）：把折扣发给"本来就会买"的高意愿用户，白白损失利润

300-600 万元⭐⭐⭐☆☆

causalexperimentforecastingoptimization客服与VOC

Review Pain-Point Mining（竞品差评痛点挖掘）

14-用户分析

想进入"电动吸奶器"品类，但已有 Momcozy/Medela/Spectra 等强竞品

50-100 万元⭐⭐☆☆☆

causalexperiment广告与投放客服与VOC

时空注意力混合专家补全 - 高缺失率下的多维流量恢复

14-用户分析

现有时序→空间的序贯方法在块状缺失（block-missing）场景下失效——当某个渠道或时段整块数据缺失时，无法提取有效特征。同时，静态图结构无法适应分布偏移（非平稳流量数据的动态空间依赖）。

10-30 万⭐⭐⭐☆☆

causalexperimentforecastingoptimization广告与投放

Session意图漂移建模 - 跨会话用户购买意图变化检测

14-用户分析

现有电商推荐系统多依赖商品标题、价格等表层属性推断用户意图，且只关注单次购买或单会话内的短期偏好变化。SessionIntentBench 的核心创新在于：提出意图树（Intention Tree）概念，通过跨会话建模用户意图的时序演化，构建大规模多模态意图基准。

⭐⭐⭐☆☆

causalexperimentforecastingoptimizationrecommendationpricing客服与VOC推荐与搜索定价与利润

Shopping Companion — 跨会话偏好记忆购物助手（4B≈GPT-5，Lazada真实数据）

14-用户分析

传统推荐系统的致命缺陷：每次会话从零开始——用户上周告诉导购"我要有机配方奶"，下次进来又要重新解释，累计咨询成本极高，转化率低。Shopping Companion 的创新在于构建跨会话长期偏好记忆，将用户偏好结构化存储，Agent 可在后续会话中直接调用，像"私人导购"一样记住每位用户的长期喜好。

10万

causalexperimentoptimizationrecommendationmulti_agentpricing广告与投放推荐与搜索MAS与智能体工程定价与利润

超稀疏矩阵补全 - 每行仅2-5个观测值的页面转移矩阵恢复

14-用户分析

传统矩阵补全（如 SoftImpute、ALS）假设"大部分条目可观测"，但电商session的页面转移矩阵天然稀疏——每个用户session只有3-5次页面跳转，导致采样概率 `p = C/d`（C≈2-5, d=页面类型数），绝大多数转移对从未被同一用户触发。

高⭐⭐☆☆☆

causalexperimentforecastingoptimization客服与VOC推荐与搜索

StaR 观点语句排序 - 排序而非生成的可解释评论分析

14-用户分析

Momcozy 暖奶器在 Amazon US/DE 各 5000+ 评论,差评包含细碎复合表达(如"加热慢又不均匀,温控也不准"). 传统 ABSA 把整句标注为"加热问题",丢失了 3 个独立改进点;直接用 LLM 总结容易生成评论中不存在的属性(如"接口设计差") - 数据要求:Amazon Review API 双市场评论 - StaR 配置: - Step 1 Candidate

80-150 万/年⭐⭐⭐☆☆

causalexperimentrecommendationragdata_collection广告与投放客服与VOC推荐与搜索数据采集与治理

TRACE 跨会话点击流用户嵌入

14-用户分析

传统序列推荐模型只看单会话内的商品点击序列，TRACE 的创新在于：把整个用户的多会话页面浏览历史（包括首页、搜索页、详情页、购物车、结账等各类页面，跨越数天甚至数周）打包成一条有序序列，送入轻量级 Transformer Encoder 学习全局用户状态嵌入。

10 万⭐⭐⭐☆☆

causalexperimentforecastingoptimizationrecommendation广告与投放供应链与补货客服与VOC推荐与搜索

电商流量来源全维度分析 - 设备/浏览器/来源的转化率诊断

14-用户分析

同样的流量，为何不同渠道/设备/浏览器的转化率差异如此悬殊？

10 万⭐⭐☆☆☆

causalexperimentoptimizationrecommendationmulti_agent广告与投放推荐与搜索数据采集与治理MAS与智能体工程

用户行为轨迹模式挖掘与预测 - 变阶马尔可夫模型

14-用户分析

母婴电商需要桑基图展示用户从首页→搜索→PDP→加购→支付的流量宽度

5000 万⭐⭐⭐☆☆

experimentforecastingoptimizationrecommendation客服与VOC推荐与搜索

User Funnel and Behavior Path Analysis

14-用户分析

用户从"知道品牌"到"下单购买"要经历多个步骤。

⭐⭐☆☆☆

experimentoptimizationpricing广告与投放定价与利润

User Profile Long Memory — 跨会话用户画像：育儿阶段感知与偏好记忆

14-用户分析

用户上月购买了 Stage 1 奶粉，系统推断宝宝约 2-3 月龄

50 万⭐⭐☆☆☆

causalexperimentrecommendationmulti_agentdata_collectionpricing客服与VOC推荐与搜索数据采集与治理MAS与智能体工程定价与利润风控与合规

不确定性感知矩阵补全 - 补全值带置信区间的页面转移矩阵恢复

14-用户分析

Utimac 的核心洞察是：不直接补全矩阵条目，而是推断数据生成过程的参数（Estimate the Process, Not the Entries）。

5-20 万⭐⭐⭐☆☆

causalexperimentforecastingoptimization广告与投放

CDA — 隐私保护因果渠道归因：无用户数据的多触点归因

15-营销投放分析

传统多触点归因（Multi-Touch Attribution, MTA）依赖用户级点击路径数据：追踪每个用户从广告曝光→点击→转化的完整旅程，才能判断各渠道贡献。

⭐⭐⭐☆☆

causalexperimentforecastingoptimization广告与投放风控与合规

Channel Saturation Curve（渠道饱和曲线建模）

15-营销投放分析

Facebook 月预算从 $5 万加到 $8 万后，ROAS 从 3.2 掉到 2.1

18-25 万元⭐⭐☆☆☆

causalexperimentoptimization广告与投放客服与VOC推荐与搜索风控与合规

Competitive Response Modeling（竞争响应建模）

15-营销投放分析

Momcozy 在美国 Prime Day 前一周突然将吸奶器搜索广告预算翻倍，我们的 impression share 从 22% 跌到 14%

15-30 万元⭐⭐☆☆☆

causalforecastingoptimizationmulti_agentpricing广告与投放供应链与补货MAS与智能体工程定价与利润

DARA Agentic MMM — LLM Agent 驱动的营销组合建模：双阶段自动调参与智能归因

15-营销投放分析

某母婴辅食品牌在美国市场同时投放 Amazon Ads、Meta（FB+IG）、TikTok，月均广告预算 $15 万美元，但各渠道的 adstock 效应差异显著（TikTok 内容影响力可持续 2-4 周，Amazon 关键词效果衰减快）

30-60 万⭐⭐⭐☆☆

causalexperimentoptimizationrecommendationragmulti_agent广告与投放推荐与搜索知识图谱与RAGMAS与智能体工程

DARA - LLM+RL 双阶段广告预算分配 Agent

15-营销投放分析

婴儿推车季节性爆款上线,Google Ads 历史只有 3-5 周数据,传统规则策略难快速找到最优出价时段 - 数据要求:近 3-5 周 Google Ads ROAS 时段数据 + 月度总预算 - DARA 配置:T = 7(一周)或 24(一天时段);Phase 1 LLM 读历史生成日预算向量;Phase 2 每日 ROAS 反馈调整下一日 - 业务价值:冷启动期 ROAS 提升

360-720 万元⭐⭐⭐⭐⭐

causalexperimentoptimizationmulti_agent广告与投放MAS与智能体工程定价与利润

GenAI Advertising — 无 Cookie 生成式受众定向 & LLM 原生广告拍卖

15-营销投放分析

匿名访客（未授权追踪）向 AI 助手提问穿搭，传统推荐因无 Cookie 完全失效，品牌白白流失高意图实时流量 - 数据要求：用户自然语言查询文本 + SKU 库（含品类、场景标签、图片描述）+ 广告主实时出价 - GenAI 方案： - 用户问："我下周去海边参加婚礼，梨形身材，有什么建议

15 万⭐⭐☆☆☆

causalexperimentforecastingoptimizationrecommendationmulti_agentfraud_detectionpricing广告与投放供应链与补货客服与VOC推荐与搜索MAS与智能体工程定价与利润风控与合规

Geo-Level Marketing Effectiveness（地理级营销效果）

15-营销投放分析

同一广告在美国加州和德国巴伐利亚的效果完全不同。Geo-level 分析用地理准实验（Geo Experiment）估计各区域的因果营销效果，避免全国平均掩盖的区域异质性。

20-40 万元⭐⭐⭐☆☆

causalexperimentoptimization广告与投放

Identified Bayesian MMM — 基于高斯过程的无混淆贝叶斯营销归因

15-营销投放分析

CMO 拿到内部 MMM 报告，显示"TikTok ROAS 极高远未饱和，建议把 Meta 预算砍半全移给 TikTok"

1000 万元⭐⭐☆☆☆

causalexperimentforecastingoptimizationfraud_detection广告与投放定价与利润风控与合规

Marketing Data Pipeline — 营销归因多渠道数据采集管道

15-营销投放分析

营销归因的核心难题是数据孤岛：广告平台（Meta/Google/TikTok）、CRM（Salesforce/HubSpot）、电商平台（Amazon/Shopify）、社交媒体各持一方数据，无法直接关联。数据管道需要解决

12 万⭐⭐⭐⭐☆

causalexperimentdata_collection广告与投放数据采集与治理风控与合规

Marketing Mix Modeling (MMM) for Macro Budget Allocation

15-营销投放分析

品牌每个月在不同渠道（Facebook、Google、TikTok、KOL、线下）投入数百万广告费。

⭐⭐⭐⭐☆

causalexperimentforecastingoptimizationpricing广告与投放定价与利润

Multi-Objective Budget Allocation（多目标预算分配）

15-营销投放分析

$30 万月预算要同时做三件事——黑五冲销量（短期 ROI）、母婴博主种草（品牌搜索量）、新款吸奶器 S2 预热（新品曝光）

30-50 万元⭐⭐⭐☆☆

causalforecastingoptimizationrecommendationmulti_agent广告与投放供应链与补货推荐与搜索MAS与智能体工程

Promotion Effectiveness Evaluation with Causal ML

15-营销投放分析

促销活动期间销售额暴涨30%，这是促销的真实效果，还是"本来就会买的用户"恰好遇到了促销？

⭐⭐⭐⭐☆

causalexperimentforecastingoptimizationrecommendation广告与投放推荐与搜索

Promotion Logistics Surge Forecast — 大促物流爆仓预测：营销-履约联动容量规划

15-营销投放分析

基于营销投放数据提前 3-7 天预测物流需求峰值，驱动仓储/运力的前置性扩容决策。

20-40 万⭐⭐⭐☆☆

causalexperimentforecastingfraud_detection广告与投放供应链与补货风控与合规

ATLAS — 梯度无关持续学习：Teacher-Student 双架构在线适应

16-智能体工程

传统持续学习依赖反向传播更新模型权重，存在三个根本缺陷：必须离线批量训练（无法在服务中实时更新）、灾难性遗忘（新任务覆盖旧能力）、部署 Agent 无法自改（推理阶段参数冻结）。ATLAS 的突破在于：将"学习"从参数空间迁移到系统编排层，通过持久学习记忆（Persistent Learning Memory, PLM）存储经验蒸馏后的指导性知识，无需触碰模型权重。

⭐⭐⭐☆☆

causalexperimentforecastingoptimizationmulti_agent供应链与补货客服与VOCMAS与智能体工程

仿生粘菌主动上下文剪枝 — Focus Agent 自主压缩架构

16-智能体工程

Focus 借鉴 Physarum polycephalum(多头绒泡菌,俗称粘菌)的探索-收缩策略,把 LLM agent 从被动 "append-only" 模式升级为主动 "explore → compress → withdraw" 模式

⭐⭐⭐☆☆

causalexperimentmulti_agentpricing客服与VOCMAS与智能体工程定价与利润风控与合规

AgeMem — LTM+STM 统一 Agent 记忆：RL 自适应管理跨会话知识

16-智能体工程

AgeMem 是首个将 LTM（长期记忆）和 STM（短期记忆）统一到 Agent Policy 的端到端框架。传统方案把两种记忆当作独立模块，由外置 Memory Manager 或启发式 trigger 决策，导致组合效果差、部署成本高（需要额外 expert LLM）。AgeMem 的突破在于：记忆操作本身就是 action，由同一个 LLM policy 通过 RL 学习"何时调什么"。

10 万⭐⭐⭐☆☆

causalexperimentoptimizationmulti_agentpricing广告与投放客服与VOC推荐与搜索MAS与智能体工程定价与利润风控与合规

Agent Error Budget — 双向错误预算：自主权随可靠性动态调整

16-智能体工程

传统 SRE 错误预算是单向消耗品：违反 SLO 就消耗预算，预算耗尽就停止发布，恢复后窗口重置。Agent 双向错误预算在此基础上引入自主权预算（Autonomy Budget）：好行为可以赢回预算，自主权随可靠性动态升降。

⭐⭐☆☆☆

causalexperimentmulti_agentpricing供应链与补货客服与VOCMAS与智能体工程定价与利润

Agent Fault Tolerance（Agent 容错回退）

16-智能体工程

Agent 执行可能因 API 超时、LLM 输出格式错误、工具返回异常而失败。容错机制：(1) Retry with exponential backoff（$t_{retry} = \min(t_{base} \cdot 2^n, t_{max})$）；(2) Fallback 策略——LLM 失败切备选模型，工具失败用简化版；(3) Circuit Breaker——连续失败 N 次后停止尝试，避免雪崩。

5-15 万元⭐⭐☆☆☆

causalforecastingoptimizationmulti_agent供应链与补货MAS与智能体工程

Whispers of Wealth — Agent 支付协议安全红队：Branded/Vault Whisper 攻击

16-智能体工程

WF-D 选品扫描工作流中，AI 导购 Agent 根据母婴产品描述为用户推荐商品

5000 万⭐⭐☆☆☆

causalexperimentrecommendationmulti_agent客服与VOC推荐与搜索MAS与智能体工程风控与合规

Agent SLO Manager — 三层 SLI 体系：服务/任务/判断质量

16-智能体工程

传统 pass@1 仅衡量"至少一次成功"，无法反映 Agent 在生产环境的持续可靠性。Agent 可靠性需要三层 SLI 互补

⭐⭐☆☆☆

experimentrecommendationmulti_agent广告与投放供应链与补货推荐与搜索数据采集与治理MAS与智能体工程风控与合规

Agent Safety Guardrails（Agent 安全对抗护栏）

16-智能体工程

LLM Agent 面临 Prompt Injection、Jailbreak、工具误用等安全风险。三层防护：(1) 输入过滤——检测注入模式；(2) 工具调用前置验证——参数白名单+范围检查；(3) 输出审计——敏感信息脱敏。

10-30 万元⭐⭐☆☆☆

experimentoptimizationmulti_agent客服与VOC推荐与搜索MAS与智能体工程风控与合规

EComStage — 电商 Agent 三阶段(Perception/Planning/Action)双向 Benchmark

16-智能体工程

EComStage 解决现有 e-commerce benchmark 只看"最终任务是否成功"的盲点。它把 LLM Agent 的推理过程分解为三阶段评估,并首次同时覆盖 customer-oriented 和 merchant-oriented 两类视角

⭐⭐⭐☆☆

experimentoptimizationrecommendationragmulti_agent客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程

AgentTrace — 因果图根因分析：0.12s 定位多 Agent 故障

16-智能体工程

AgentTrace 的核心洞察是：多 Agent 系统（MAS）的故障传播是确定性的因果链，而非需要 LLM 进行语义推理的模糊问题。

5-20 万⭐⭐☆☆☆

causalexperimentforecastingragmulti_agentdata_collection供应链与补货客服与VOC知识图谱与RAG数据采集与治理MAS与智能体工程

AgentTrust — 运行时安全拦截：95% 准确率，< 1ms，MCP 集成

16-智能体工程

为什么基础设施沙箱不足：容器/seccomp 工作在系统调用层，不理解语义。例如 `rm -rf /tmp/orders/` 在文件系统层完全合法，但在补货 Agent 上下文中是灾难性操作。AgentTrust 在工具调用层工作，理解"操作意图"而非仅检查"操作权限"。

20-60 万元⭐⭐☆☆☆

causalexperimentmulti_agentfraud_detection供应链与补货客服与VOCMAS与智能体工程风控与合规

AgeMem — 统一 LTM+STM 管理的 Agentic Memory

16-智能体工程

AgeMem(Agentic Memory) 颠覆了传统 LTM/STM 分离架构,把记忆管理整合到 Agent 的 policy 本身。现有方法把 LTM 与 STM 当作两个独立模块,要么用 trigger-based 启发式,要么外挂 Memory Manager,导致

STM Filter + Summary 让对话 context 维持紧凑⭐⭐⭐⭐☆

causalexperimentoptimizationrecommendationragknowledge_graphmulti_agent广告与投放客服与VOC推荐与搜索知识图谱与RAG数据采集与治理MAS与智能体工程

Subterranean Agent — 将工作流 SOP 编译进 LLM 权重

16-智能体工程

每日需要上架数百个 SKU，每个 SKU 经过「标题优化→图片描述生成→合规检查→关键词填写」4 步 SOP，当前用 LangGraph 编排，frontier 模型成本约 $0.15/SKU × 1000 SKU = $150/天

$150/天 → 约 $0.5–1.2/天（按 128–462× 节省比例）

causalexperimentoptimizationmulti_agentvisual_generation广告与投放客服与VOCMAS与智能体工程风控与合规视觉内容生成

Atomix — Agent 工具调用事务性：故障注入成功率 0-7% → 37-57%

16-智能体工程

Atomix 为 Agent 工具调用引入事务语义，解决多步 Agent 工作流在故障（网络抖动、服务超时、LLM 幻觉）下产生的中间态污染问题。无事务保护时，30% 故障注入场景的成功率仅 0-7%；Atomix Tx-Full 模式将其提升至 37-57%，媲美快照回滚（CR）。

10万⭐⭐⭐☆☆

causalexperimentforecastingmulti_agent广告与投放供应链与补货MAS与智能体工程

SkillForge — 领域特定自演化 Agent Skill 萃取与优化

16-智能体工程

母婴出海跨境客服 1 单可能涉及 10+ 国家、5+ 平台(Shopify/Amazon/TikTok Shop/独立站)、30+ 产品类目,人工写 SOP 速度跟不上业务扩张

bad case 自动诊断省去人工质检 30%-50% 工时⭐⭐⭐⭐☆

causalexperimentoptimizationknowledge_graphmulti_agent广告与投放客服与VOC知识图谱与RAGMAS与智能体工程

AutoSkill — 经验驱动终身学习：Skill 自进化版本管理

16-智能体工程

RAG 的局限：被动检索，只能复用已显式存入的知识，无法从对话轨迹中自动归纳模式；Fine-tuning 的局限：参数固化后无法增量更新，每次新能力都需全量重训，知识以黑盒形式埋在权重里，不可审计不可编辑。

⭐⭐⭐☆☆

causalexperimentragmulti_agent广告与投放供应链与补货客服与VOC知识图谱与RAG数据采集与治理MAS与智能体工程

CASCADE — 案例推理部署时学习：Contextual Bandit 无参数自适应

16-智能体工程

部署时学习（Deployment-Time Learning, DTL）是 CASCADE 提出的第三个 LLM 生命周期阶段：预训练（Pre-training）→ 微调（Fine-tuning）→ 部署时学习。现有方案只在前两个阶段学习，部署后模型冻结，无法从实际使用中积累经验。

⭐⭐☆☆☆

causalexperimentoptimizationrecommendationragmulti_agent广告与投放客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程

CapSeal — Agent 秘密中介：能力封装取代直接密钥暴露

16-智能体工程

传统方式将 API Key 存入环境变量或配置文件，Agent 运行时直接读取。Prompt Injection 攻击可诱导 Agent 将密钥外泄。CapSeal 彻底切断 Agent 与明文密钥的直接联系。

⭐⭐⭐☆☆

causalexperimentmulti_agent广告与投放供应链与补货MAS与智能体工程

CausalFlow — LLM Agent 因果调试：失败轨迹 → 最小反事实修复

16-智能体工程

CausalFlow 将 Agent 的一次执行视为有序步骤序列

⭐⭐⭐☆☆

causalexperimentforecastingoptimizationmulti_agent广告与投放供应链与补货MAS与智能体工程风控与合规

Skill 自动演化与验证 — EvoSkills 双 LLM 协同优化

16-智能体工程

EvoSkills 解决 LLM Agent 多文件 Skill 包自动生成的两个根本挑战

⭐⭐⭐⭐☆

causalexperimentoptimizationmulti_agent客服与VOCMAS与智能体工程

ACON — Agent 长上下文压缩与 NL 准则优化

16-智能体工程

跨境母婴客服 1 次对话经常 10-30+ 轮,Agent 在执行 RCA(Root Cause Analysis)、生成回复、生成报告时需要历史完整对话 + 多次 API 返回(订单详情、物流数据、产品规格)

90% 成本, 性能接近 GPT-5⭐⭐⭐⭐☆

causalexperimentoptimizationmulti_agentdata_collection广告与投放供应链与补货客服与VOC数据采集与治理MAS与智能体工程

Cost-Aware Agent Scheduling（成本感知调度）

16-智能体工程

不是所有 Agent 任务都需要 GPT-4——简单分类任务用 SLM（Small LM），复杂推理用 LLM。成本感知调度根据任务复杂度动态路由到最优模型。

⭐⭐☆☆☆

causalexperimentoptimizationmulti_agent客服与VOCMAS与智能体工程

Cultural Adaptation Agent — 跨文化适应：母婴跨境的本地化 AI 策略

16-智能体工程

语言翻译是跨境电商的最低门槛，真正影响转化的是文化适配：同一款婴儿奶粉，美国妈妈关注"科学配方/AAP认证"，德国妈妈关注"有机/欧盟标准"，日本妈妈关注"安心品质/无添加"——这些差异不是语言问题，而是深层文化价值观差异。

⭐⭐⭐☆☆

causalexperimentrecommendationmulti_agentdata_collectionpricing广告与投放客服与VOC推荐与搜索数据采集与治理MAS与智能体工程定价与利润风控与合规

TDP — DAG 任务解耦规划：82% Token 节省 + 错误隔离

16-智能体工程

传统 LLM Agent 在执行复杂任务时，把所有历史消息塞入 context window（"full history" 模式），导致两个问题

⭐⭐☆☆☆

causalexperimentforecastingmulti_agentvisual_generation广告与投放供应链与补货推荐与搜索MAS与智能体工程风控与合规视觉内容生成

KLong — 超长时域 Agent 训练：轨迹分割 SFT + 渐进 RL

16-智能体工程

训练 LLM Agent 执行超长时域任务（50+ 步）面临两大瓶颈

⭐⭐⭐⭐☆

causalexperimentforecastingoptimizationmulti_agentdata_collectionpricing供应链与补货推荐与搜索数据采集与治理MAS与智能体工程定价与利润风控与合规

LDP — 身份感知 Agent 通信协议：模型级路由 + 37% Token 节省

16-智能体工程

Google A2A 和 Anthropic MCP 这两大主流 Agent 通信协议存在共同缺陷：不暴露模型级属性。

⭐⭐☆☆☆

causalexperimentmulti_agentpricing客服与VOC数据采集与治理MAS与智能体工程定价与利润风控与合规

LMM-Searcher — 长链多模态 Agent：UID 占位符按需加载图片

16-智能体工程

LMM-Searcher 解决长链多模态 Agent 的上下文爆炸问题：在 100 轮搜索会话中，若每张图片直接嵌入为 base64（约 1,000-3,000 tokens），50 张图片就会占用 50,000-150,000 tokens，远超实用预算。

⭐⭐☆☆☆

causalexperimentmulti_agentvisual_generation推荐与搜索MAS与智能体工程风控与合规视觉内容生成

Shopping Companion — 记忆增强的长期偏好购物 Agent

16-智能体工程

Shopping Companion 解决两个长期被忽视的问题:(1) 缺少能评估跨 session 偏好记忆的端到端购物 benchmark;(2) 现有方法把"偏好识别"和"购物执行"当作独立模块,没有端到端联合优化。它把购物 Agent 形式化为 POMDP,并提出两阶段统一框架 + 双奖励 RL 训练。

⭐⭐⭐⭐☆

experimentoptimizationrecommendationragmulti_agentpricing广告与投放供应链与补货客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润

MCP + A2A 双协议栈 — Orchestrated Multi-Agent 企业架构

16-智能体工程

The Orchestration of Multi-Agent Systems 把 LLM Agent 系统的演化分三阶段:单 Agent → 松耦合多 Agent → orchestrated 多 Agent。论文的核心贡献是把"orchestration"形式化为四层架构 + 两类协议

⭐⭐⭐⭐☆

experimentragmulti_agentvisual_generation广告与投放客服与VOC推荐与搜索知识图谱与RAG数据采集与治理MAS与智能体工程风控与合规视觉内容生成

MCP Tool Use 评估基准 — TFS/TEFS 双指标与干扰测试

16-智能体工程

MCPAgentBench (北京大学 + ZTE, 2026) 是首个专注于工具选择与执行效率的 MCP 评估基准。现有基准 (MCP-Universe, MCP-RADAR) 主要测正确性，忽略了一个关键问题：模型能完成任务，但效率极低 —— 该并行时串行、该串行时并行、传过多参数、反复试错。

⭐⭐⭐☆☆

causalexperimentoptimizationrecommendationmulti_agent客服与VOC推荐与搜索MAS与智能体工程风控与合规

MUZZLE — Web Agent 间接 Prompt Injection 红队框架

16-智能体工程

间接 Prompt Injection（IPI）的核心机制：攻击者无法直接访问 Agent 的系统提示，但可通过控制 Agent 抓取的外部内容（商品描述、用户评论、网页正文）向 Agent 上下文注入恶意指令，使 Agent 偏离原始任务目标执行攻击者意图。

⭐⭐☆☆☆

causalexperimentrecommendationmulti_agent客服与VOC推荐与搜索MAS与智能体工程风控与合规

Memory-as-Action — RL 内嵌式记忆操作策略 (DCPO 训练)

16-智能体工程

MemAct(Memory-as-Action) 把"记忆管理"从外部启发式控制器(sliding window / 外部 summarizer)升级为 agent policy 内嵌的可学习 action

⭐⭐⭐⭐⭐

causalexperimentoptimizationmulti_agent推荐与搜索MAS与智能体工程

开源 Tool Use 基座模型选型 — Hermes 4 混合推理家族

16-智能体工程

Hermes 4 是 Nous Research 发布的开源权重混合推理模型家族,核心贡献是证明开源模型可以通过系统性后训练(pipeline)达到接近闭源前沿模型的 tool use 和推理能力。

⭐⭐⭐☆☆

experimentoptimizationmulti_agent客服与VOC推荐与搜索MAS与智能体工程风控与合规

编排轨迹驱动的强化学习 — MAS RL 三维设计框架

16-智能体工程

随着 LLM agent 从单 agent 工具调用进化为协调团队(coordinated teams),RL 的优化对象不再是个体 action,而是编排轨迹(orchestration trace) —— 一个包含 spawn(生成)、delegate(委派)、communicate(通信)、aggregate(聚合)、stop(停止)决策的时序交互图。

⭐⭐⭐⭐⭐

causalexperimentoptimizationmulti_agent客服与VOC推荐与搜索数据采集与治理MAS与智能体工程风控与合规

Progent — 最小权限 Agent 框架：SMT 验证 + 单调约束性

16-智能体工程

最小权限原则在 Agent 中的实现：传统应用最小权限通过 OS/IAM 静态配置实现，但 LLM Agent 的工具调用集合在运行时动态变化，需要动态感知策略。Progent 用符号规则表示权限策略：`{tool: "purchase_order.create", constraints: {"amount": {"max": 1000}}}`，支持在任务执行中实时评估。

30-80 万元⭐⭐⭐☆☆

causalexperimentoptimizationmulti_agent广告与投放供应链与补货MAS与智能体工程风控与合规

ReliabilityBench — Agent 生产可靠性三维评估：pass@1 高估 20-40%

16-智能体工程

ReliabilityBench 是首个系统性评估 LLM Agent 在生产级压力条件下可靠性的基准框架（arXiv 2601.06112，2026年1月）。它的核心贡献是把单维"能不能完成任务"扩展为三维 R(k, ε, λ) 可靠性曲面

⭐⭐☆☆☆

causalexperimentrecommendationmulti_agentpricing供应链与补货推荐与搜索MAS与智能体工程定价与利润

SLM Tool Calling 成本优化 — 350M 参数击败 LLM

16-智能体工程

AWS 2026 年的实证研究证明：通过领域特定 SFT，仅 350M 参数的小型语言模型 (SLM) 可以在 tool calling 任务上超越 175B+ 参数的 LLM。核心洞察是参数效率 > 参数规模——通用 LLM 的绝大多数参数被优化用于通用语言理解而非 tool manipulation，导致"参数稀释"。

⭐⭐☆☆☆

causalexperimentoptimizationmulti_agent供应链与补货客服与VOCMAS与智能体工程风控与合规

Sandlock — 轻量 Agent 沙箱：5ms 启动，HTTP ACL，可逆文件系统

16-智能体工程

为什么容器/microVM 不适合短命令 Agent：Docker 容器启动需 500ms-2s，microVM（Firecracker）需 125ms+，对于每次工具调用仅数十毫秒的 Agent 来说开销过大。Sandlock 通过 Rust 实现，启动延迟 5ms，专为短命令高频执行设计，Redis 集成零额外开销。

20-50 万元⭐⭐⭐☆☆

causalexperimentmulti_agent供应链与补货MAS与智能体工程

SoK Agentic Skills — Agent Skill 全生命周期与方法论底座

16-智能体工程

SoK Agentic Skills(Systematization of Knowledge)是 Agent Skill 领域第一篇综合 survey,把分散在 Voyager / CodeAct / Reflexion / Claude Skills / GPT Store / MCP 等系统中的"Skill 概念"统一为一个理论框架。它解决三个根本问题

⭐⭐⭐☆☆

causalexperimentrecommendationragknowledge_graphmulti_agent供应链与补货客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程

任务自适应拓扑路由 — AdaptOrch 动态多智能体编排

16-智能体工程

AdaptOrch 针对 LLM 能力收敛趋势(2026 年前沿模型 MMLU/HumanEval 差距 <5%)提出一个关键洞察:当个体模型能力趋同时,编排拓扑(拓扑选择) 的方差贡献远超模型选择的贡献,成为系统性能的主变量。

⭐⭐⭐⭐☆

causalexperimentforecastingrecommendationmulti_agent广告与投放客服与VOC推荐与搜索MAS与智能体工程风控与合规

Tool Auto Discovery — Agent 工具自动发现：OpenAPI + MCP Schema 自注册

16-智能体工程

当 Agent 系统规模膨胀至 100+ 工具时，手动注册成为瓶颈：每次新 API 上线都需要开发者手工编写 ToolDefinition、更新路由表、验证参数类型——一个典型企业集成需要 2 个工作日。

⭐⭐⭐☆☆

causalexperimentmulti_agentpricing广告与投放供应链与补货数据采集与治理MAS与智能体工程定价与利润

Tool Call Decision Framework — 必要性/效用/可负担性三维工具调用决策

16-智能体工程

LLM 工具调用存在系统性错位：模型既会过度调用（把可推理的问题交给工具），也会遗漏调用（低估工具对复杂查询的价值）。根本原因在于模型自感知与任务实际需求之间存在认知盲区——模型过度自信于自身知识覆盖，却对边界外的未知盲区无感知。

⭐⭐☆☆☆

causalexperimentforecastingoptimizationmulti_agentpricing客服与VOCMAS与智能体工程定价与利润风控与合规

MCP Tool 描述质量审核 — 六维 Smell 扫描与动态路由

16-智能体工程

Queen's University 2026 年的大规模实证研究揭示：97.1% 的 MCP tool 描述至少含有一个 smell，这些描述缺陷直接导致 FM 选错工具、传错参数或产生不必要的交互步骤。论文提出六维评分 rubric + 动态组件路由，在提升 agent 准确率 (+5.85pp) 的同时控制 token 开销 (+67.46% steps 的 trade-off)。

⭐⭐⭐☆☆

causalexperimentoptimizationrecommendationragmulti_agent供应链与补货客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程风控与合规

VLM E-commerce Adaptation — 大规模视觉语言模型电商适配

16-智能体工程

通用 VLM（如 GPT-4V、LLaVA 等）在电商场景表现欠佳，根本原因是三大领域偏差：同款多图（同一产品的主图/侧面图/背面图/细节图共享同一 listing，模型需跨图聚合）、属性中心化（电商问答 90% 是围绕结构化属性如"材质/尺寸/颜色"，与图片描述类任务截然不同）、噪声图片（用户上传的低质量/遮挡/非标图占比极高）。

1.6 万元⭐⭐⭐☆☆

causalexperimentmulti_agentvisual_generation数据采集与治理MAS与智能体工程风控与合规视觉内容生成

XSkill — 多模态 Agent 双流自进化：经验+技能协同积累

16-智能体工程

XSkill 解决的是 AI Agent 的"每次从零开始"问题——传统 Agent 缺乏跨任务的知识积累机制，执行 100 次类似任务的性能与第 1 次几乎相同。XSkill 通过双流架构实现持续自进化

5-10 万⭐⭐⭐☆☆

causalexperimentforecastingoptimizationrecommendationmulti_agentpricingvisual_generation客服与VOC推荐与搜索MAS与智能体工程定价与利润视觉内容生成

AIGP — LLM 动态定价：长期 GMV 对齐框架（+13% GMV A/B实测）

17-价格优化

业务痛点：吸奶器年度销量呈强季节性（Q3-Q4 旺季 GMV 占全年 65%），且 Momcozy 经常在大促前一周大幅降价抢占位次

1,321 万元

experimentforecastingoptimizationrecommendationpricing供应链与补货客服与VOC推荐与搜索定价与利润

Bundle Pricing Strategy（捆绑定价策略）

17-价格优化

1+1>2 的定价魔法——吸奶器 + 配件捆绑包的总价不是简单相加，而是利用消费者对捆绑包的心理估值高于单品之和（或互补品的联合需求），找到最大化总利润的捆绑价格。

10-15 万⭐⭐☆☆☆

causalexperimentforecastingoptimizationpricing供应链与补货定价与利润

Competitive Price Monitoring（竞品价格监测与响应）

17-价格优化

竞品价格监测不只是"看别人卖多少钱"，而是建立价格-转化率的因果响应模型，在竞品降价时量化"不跟降会损失多少"和"跟降能获得多少"，做出有数据支撑的响应决策。

5-60 万元⭐⭐☆☆☆

causalexperimentoptimizationpricing广告与投放定价与利润风控与合规

Contextual Dynamic Pricing — 最优上下文定价：O(√dT) Regret + LDP 隐私保护

17-价格优化

上下文定价（Contextual Dynamic Pricing）将传统 MAB 定价问题扩展为依赖上下文的序贯决策。买家的潜在估值（valuation）被建模为

⭐⭐⭐☆☆

causalexperimentoptimizationknowledge_graphpricing知识图谱与RAG定价与利润风控与合规

Cross-Border Price Harmonization（跨境价格协调）

17-价格优化

同一 SKU 在美国、德国、英国定价不能完全独立——消费者会跨市场比价，亚马逊全球店铺会显示价格差异。需要在"市场本地化定价"和"全球价格一致性"之间找最优平衡。

8-15 万元⭐☆☆☆☆

causalexperimentoptimizationpricing广告与投放定价与利润

Dynamic Pricing with Demand Elasticity（动态定价与需求弹性）

17-价格优化

吸奶器在美国定价 $129，德国 €119，英国 £99

50 万⭐⭐⭐☆☆

experimentforecastingoptimizationmulti_agentpricing广告与投放供应链与补货MAS与智能体工程定价与利润

Markdown Optimization（折扣清仓定价优化）

17-价格优化

S1 吸奶器库存 500 件，成本 $60，原价 $129

20-50 万元⭐⭐☆☆☆

causalforecastingoptimizationpricing供应链与补货定价与利润

Price Signal Collection — 竞品价格信号实时采集与结构化

17-价格优化

在于：数据异构性（多平台格式差异）、反爬对抗（动态 JS 渲染、验证码）、实时性需求（价格窗口窄、竞品调价响应快）三重矛盾。

73.2 万⭐⭐☆☆☆

causalexperimentforecastingoptimizationdata_collectionfraud_detectionpricing广告与投放数据采集与治理定价与利润

AR Logistics Visualization — 增强现实包裹可视化追踪：跨境物流透明化与客服AI视频答复

18-物流履约

跨境母婴电商的物流追踪长期依赖纯文本状态更新（"已揽收"、"在途中"、"清关中"），消费者对包裹实际位置和预期到达时间高度不确定，导致客服咨询量激增。AR Logistics Visualization 将三个技术栈融合

12.7 万⭐⭐⭐☆☆

causalexperimentforecastingfraud_detectionvisual_generation广告与投放供应链与补货客服与VOC风控与合规视觉内容生成

Cross-Border Logistics Routing（跨境物流路径优化）

18-物流履约

跨境物流的核心是多式联运路径优化——海陆空铁四种运输方式在不同路段的成本/时效组合中找最优。最短路径 Dijkstra 扩展为多目标（成本、时效、碳排放）Pareto 最优路径。

30-50 万元⭐⭐☆☆☆

causalforecastingoptimizationfraud_detection供应链与补货风控与合规

Delivery Promise Optimization — 时效承诺优化：转化率与准时率的帕累托

18-物流履约

从历史配送记录中提取经验分位数，用 P95 分位数作为保守承诺基线

⭐⭐☆☆☆

causalexperimentforecastingoptimizationmulti_agent供应链与补货推荐与搜索MAS与智能体工程

GraphDeepAR — 图神经网络概率需求预测：商品关联 + 退货预测

18-物流履约

传统需求预测（DeepAR、Prophet）将每个 SKU 独立建模，忽视了商品间的需求传导效应：奶粉缺货时纸尿裤也会滞销；新款婴儿车上市带动安全座椅需求。GraphDeepAR 的核心创新是将商品间关联关系显式建模为图结构

⭐⭐⭐☆☆

causalexperimentforecastingmulti_agent供应链与补货MAS与智能体工程

Last-Mile Delivery Prediction（最后一公里配送时效预测）

18-物流履约

预测从"到达目的国仓库"到"用户签收"的时长。用生存分析（Cox PH 或 AFT 模型）建模配送时长分布，考虑承运商、目的地邮编区、包裹体积、节假日等协变量。

4-6 万元⭐⭐☆☆☆

causalforecasting供应链与补货客服与VOC

Logistics Fraud Detection — 物流链路欺诈检测：虚假收货、刷单物流与地址篡改的识别与拦截

18-物流履约

"Item Not Received"（INR）欺诈是跨境母婴电商最常见的纠纷类型，占纠纷总量约 35%

月均 -$3,200⭐⭐⭐☆☆

causalexperimentrecommendationknowledge_graphfraud_detection供应链与补货推荐与搜索知识图谱与RAG风控与合规

Returns Reverse Logistics（退货逆向物流）

18-物流履约

预测退货概率 + 优化退货处理路径。退货概率用 XGBoost 建模（产品类别、价格、用户历史退货率、配送时长），退货处理用规则+成本优化——退货到 FBA vs 第三方仓 vs 弃置。

6-10 万元⭐⭐☆☆☆

causalforecastingoptimizationfraud_detectionpricing供应链与补货客服与VOC定价与利润风控与合规

Supplier Lead Time Buffer — 供应商交货期缓冲：非正态分布下的安全库存

18-物流履约

传统安全库存公式（$SS = Z \cdot \sigma_{LT} \cdot \bar{D}$）基于正态分布假设，但实际跨境供应链中交货期呈现两个典型特征

⭐⭐☆☆☆

causalexperimentforecasting供应链与补货

Click Fraud Detection（广告刷量检测）

19-风控反欺诈

检测广告点击中的无效流量（IVT）——Bot 点击、竞品恶意点击、重复点击。用时间序列异常 + 行为模式识别。

6-15 万元⭐⭐☆☆☆

causalexperimentoptimizationdata_collectionfraud_detection广告与投放客服与VOC数据采集与治理风控与合规

DS-DGA-GCN — 动态图假评论群组检测：冷启动新品防刷评

19-风控反欺诈

核心思想：在"产品 → 评论 → 评论者"三方动态异构图上检测刷评团伙群组。不看单条评论文本质量，而是看评论者之间的网络行为模式——真实用户构成稀疏随机网络，刷评团伙则共现密集、行为高度同步。

⭐⭐⭐☆☆

causalexperimentknowledge_graphfraud_detection客服与VOC知识图谱与RAG风控与合规

Fraud Signal Collection — 欺诈信号数据采集（刷单行为、虚假评论、异常流量）

19-风控反欺诈

欺诈检测系统的核心上限由欺诈信号采集的覆盖度和质量决定。母婴电商面临的三类典型欺诈

48 万⭐⭐☆☆☆

experimentmulti_agentdata_collectionfraud_detection广告与投放客服与VOC数据采集与治理MAS与智能体工程风控与合规

FraudSquad — LLM 生成虚假评论检测：LM 嵌入 + 门控图变换器

19-风控反欺诈

核心思想：LLM 生成的虚假评论文本质量极高（语法流畅、情感真实），传统文本特征工程（词频/情感/长度）已失效。FraudSquad 转变思路——不只看"单条评论写得怎样"，而是看"这个评论者在评论图中的行为模式是否异常"。

⭐⭐⭐☆☆

causalexperimentfraud_detection广告与投放客服与VOC推荐与搜索风控与合规

Identity Fraud Detection — 多维账号欺诈检测：设备+行为+网络三重验证

19-风控反欺诈

核心思想：三维欺诈信号融合检测账号欺诈——设备指纹相似度（识别同一设备多账号）+ 行为序列异常（购买/浏览模式偏差）+ 账号关联网络社区（图社区发现）。三维信号通过加权融合输出欺诈概率，任一维度异常均触发预警。

⭐⭐☆☆☆

experimentforecastingmulti_agentfraud_detection供应链与补货客服与VOCMAS与智能体工程风控与合规

Review Fraud Detection（虚假评论检测）

19-风控反欺诈

GNN 图神经网络检测虚假评论——不是看单条评论文本，而是看评论者-产品-评分之间的关系图。虚假评论团通常呈现异常图模式：同批次账号、评分极端（1 或 5 星）、评论时间集中、文本相似度高。

5-15 万元⭐⭐⭐☆☆

causalknowledge_graphmulti_agentfraud_detection客服与VOC知识图谱与RAGMAS与智能体工程风控与合规

Transaction Anomaly Detection（异常交易检测）

19-风控反欺诈

Isolation Forest + 动态阈值检测异常交易模式。特征：订单金额、支付方式、IP 国家 vs 收货国家、下单到支付间隔、同一 IP 下单频率、地址变更次数。

3-8 万元⭐⭐☆☆☆

experimentoptimizationfraud_detection广告与投放客服与VOC风控与合规

AnchorCrafter — Virtual Anchor Product Demo（虚拟主播带货视频生成）

20-AI视频生成

在 TikTok 美国站推吸奶器，需要大量真人主播演示视频——但海外主播贵（$200-500/条），中文主播语言不通，且更换主播需重新拍摄

50-100 万元⭐⭐⭐⭐☆

causalexperimentvisual_generation广告与投放风控与合规视觉内容生成

Aquarius — Brand Video Generation（品牌营销视频生成）

20-AI视频生成

母婴品牌需要在美/德/英/日 4 个市场投放品牌视频广告——每个市场需要不同模特、不同语言字幕、不同节日主题（美国感恩节/德国圣诞节/日本新年）

80-150 万元

causalexperimentoptimizationmulti_agentvisual_generation广告与投放MAS与智能体工程视觉内容生成

Brand Video Generation — AI品牌视频生成：从文本/图像到高保真营销视频的全链路技术

20-AI视频生成

如何将品牌语义（Logo、色调、产品特征）与视频扩散模型对齐，在保留用户意图（语义保真）的同时实现自然的品牌可见性。

4.5 万元⭐⭐☆☆☆

causalexperimentoptimizationknowledge_graphmulti_agentvisual_generation广告与投放知识图谱与RAGMAS与智能体工程视觉内容生成

BrandFusion — Multi-Agent Brand Integration（品牌无缝植入视频）

20-AI视频生成

22-数据采集工程

论文：SIGIR'26 [2602.23620] + ICML'26 [2602.07298] + SCALR [2606.00282]

⭐⭐⭐☆☆

experimentforecastingrecommendationdata_collection供应链与补货推荐与搜索数据采集与治理

Web Page Change Detection — 网页变化检测：VLM 视觉差异识别与 DOM 原子性保护

22-数据采集工程

论文：DiffSpot [2605.29615] + DOM Atomicity [2603.00476]

⭐⭐⭐☆☆

causalexperimentoptimizationdata_collectionpricing供应链与补货数据采集与治理定价与利润