paper2skills Playbook

知识图谱与RAG

Causal Cohort Analysis — 因果队列分析:促销干预的长期用户行为效应

01-因果推断

传统队列分析(Cohort Analysis)追踪同一时期加入的用户群体的行为轨迹,但无法剥离选择偏差:高价值用户本来就会复购,促销只是"锦上添花"而非真正驱动因素。直接比较"接受促销的队列 vs 未接受促销的队列",会高估促销效果 30-60%。

200-500 万元⭐⭐⭐☆☆
causalexperimentragpricing客服与VOC知识图谱与RAG定价与利润

认知不确定性共形评分 - 数据稀疏区域自适应区间加宽

01-因果推断

标准共形预测对所有数据点使用统一的非一致性分数,无法区分"数据多的区域"和"数据少的区域"。根本原因:传统共形分数只捕捉偶然不确定性(aleatoric uncertainty,数据本身的随机性),对认知不确定性(epistemic uncertainty,训练数据不足导致的模型无知)视而不见——在数据稀疏区域仍然给出窄区间,形成虚假的高置信度。

causalexperimentforecastingrag推荐与搜索知识图谱与RAG

小样本Beta修正共形预测 - 50个样本也能保证覆盖

01-因果推断

标准 Split Conformal Prediction 的覆盖保证是"期望意义"的——跨多次校准集随机抽取,平均覆盖率为 `1-α`,但单次校准的覆盖率可能远低于目标值。实验表明:当校准集 n=50 时,目标覆盖率 90% 的标准共形预测,实际违约率高达 ~40%(即 40% 的概率实际覆盖 < 90%)。

5-20 万/月⭐⭐☆☆☆
causalexperimentforecastingrag知识图谱与RAG

因果时间序列预测 - GCF 反事实需求建模

03-时间序列

平台在大促期对核心母婴 SKU(纸尿裤、婴儿车)做搜索权重提升 + 首页 Banner 曝光,需要回答"如果没做促销,需求应该是多少"——避免把自然增长功劳归到促销 - 数据要求:全品类销量历史 + 促销标记 + 商品图谱(同类竞品关系) - GCF 配置:节点=SKU,边=同品类竞品,干预=促销曝光,合成控制=未受促销的同类 - 业务价值:促销 ROI 计算精度提升 30-50%,避免

50-100 万元⭐⭐⭐⭐☆
causalexperimentforecastingknowledge_graphmulti_agent广告与投放供应链与补货知识图谱与RAGMAS与智能体工程

Conformal Prediction Demand UQ(需求预测不确定性量化)

03-时间序列

传统需求预测只给点估计("下月卖 1000 件"),业务需要区间估计("95% 置信区间: 850-1200 件")。Conformal Prediction 提供分布无关的、有限样本有效的预测区间,无需假设误差分布。

30-50 万元⭐⭐☆☆☆
causalexperimentforecastingrag供应链与补货知识图谱与RAG

Streaming Data Forecasting — 流式采集数据驱动的实时需求预测:采集→特征→预测端到端

03-时间序列

传统需求预测依赖离线批处理(T-1 日数据训练,次日生效预测),对突发事件(爆品上线、竞品大促、舆情事件)响应迟滞 12-24 小时。

60 万元⭐⭐⭐⭐☆
causalexperimentforecastingoptimizationrecommendationragdata_collectionpricing供应链与补货推荐与搜索知识图谱与RAG数据采集与治理定价与利润

PASTA - 离线悲观选品框架

04-供应链

如何仅凭历史离线日志(无需在线试错),找出使总期望收益最大化的商品展示组合。

15-30 万元⭐⭐⭐☆☆
causalexperimentforecastingoptimizationrecommendationragfraud_detectionpricing供应链与补货推荐与搜索知识图谱与RAG定价与利润风控与合规

因果图聚合权重去偏推荐 - CAGED

05-推荐系统

Momcozy 吸奶器爆款 SKU 占全部流量的 60%+,200 余款配件(替换配件、特殊尺码)几乎零曝光

500 万元
causalexperimentoptimizationrecommendationragpricing供应链与补货推荐与搜索知识图谱与RAG定价与利润

Explainable Recommendation for Business Trust

05-推荐系统

黑盒推荐系统给用户推了"吸奶器",用户会问"为什么给我推这个?

⭐⭐☆☆☆
causalexperimentforecastingoptimizationrecommendationknowledge_graphpricing推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润

MAS Collaborative Recommendation — 多智能体协同个性化推荐:LLM Agent 异构协作框架

05-推荐系统

传统推荐系统是单一模型的端到端优化,难以整合多维用户意图(价格敏感、品牌偏好、安全认证关注)。MAS Collaborative Recommendation 将推荐任务分解为多个专业化 LLM Agent 的协作问题

⭐⭐⭐⭐☆
causalexperimentforecastingoptimizationrecommendationragmulti_agentpricing广告与投放供应链与补货推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润风控与合规

AgentRouter — 知识图谱引导的多智能体路由器

08-知识图谱

大促高峰期每日 5 万条跨领域工单,正确路由率从 61% → 82%,每天减少约 10,500 条二次转单 - 单条转单处理成本约 5 元,节约运营成本 5.25 万元/天;年化 1900 万元 - 用户 CSAT 评分从 3.8 → 4.3(满分 5),复购意愿提升可观

1900 万元⭐⭐⭐☆☆
causalrecommendationragknowledge_graphmulti_agentfraud_detectionpricing广告与投放客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润风控与合规

Audience Knowledge Graph(广告受众知识图谱)

08-知识图谱

用知识图谱技术构建广告受众画像图——不是简单的标签列表,而是实体关系图:用户→购买→产品→属于→品类→适合→年龄段。基于 KG 的受众定向比关键词匹配精准 3-5 倍。

20-35 万元⭐⭐⭐☆☆
causalexperimentforecastingoptimizationrecommendationragknowledge_graphmulti_agent广告与投放供应链与补货推荐与搜索知识图谱与RAGMAS与智能体工程

CausalRAG — 因果图增强检索:语义相似 + 因果链路双轨 RAG

08-知识图谱

传统 RAG 将文档切分为固定长度的 chunk,导致原本有完整因果逻辑的段落被割裂。例如"产品A未通过认证 → 被召回 → 触发贸易禁令"这一因果链横跨多个 chunk,单个 chunk 无法表达完整逻辑。

⭐⭐⭐☆☆
causalexperimentragknowledge_graph推荐与搜索知识图谱与RAG风控与合规

CausalRAG - 因果图驱动的检索增强生成

08-知识图谱

用户反馈"机器转了两圈突然停下并闪红灯",传统 FAQ 机器人把所有带"红灯"的内容(充电时亮红灯/故障码等)全部返回,答非所问,最终用户申请退货

120-200 万元
causalrecommendationragknowledge_graphmulti_agentfraud_detection供应链与补货客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程风控与合规

面向电商的稠密检索与语义排序

08-知识图谱

传统电商搜索基于 BM25/TF-IDF 关键词匹配,无法理解语义。例如用户搜"缓解涨奶 pain",关键词系统只能匹配包含"pain"或"涨奶"字样的商品,无法召回"吸奶器"、"冷敷贴"等语义相关但关键词不匹配的商品。

⭐⭐⭐☆☆
causalexperimentrecommendationragknowledge_graphpricing客服与VOC推荐与搜索知识图谱与RAG定价与利润

KG 实体消歧与去重(Entity Resolution & Deduplication)

08-知识图谱

电商知识图谱中同一商品在不同数据源有多种命名:中文名"吸奶器"、英文名"breast pump"、闽南语"集乳器"、品牌型号"Spectra S1"、Amazon ASIN"B07XYZ123"——若不做统一,KG 会出现大量重复节点,导致关系断裂、推理失效、检索召回率下降。实体消歧(Entity Resolution) 通过三步流水线将多源异构实体识别为同一现实对象并合并。

causalexperimentforecastingknowledge_graph推荐与搜索知识图谱与RAG数据采集与治理

GNN Foundations(图神经网络基础)

08-知识图谱

GNN 三大基础架构的统一入门:GCN(图卷积,邻居特征加权平均 $\mathbf{h}_v^{(l+1)} = \sigma(\mathbf{W}^{(l)} \sum_{u \in N(v)} \frac{\mathbf{h}_u^{(l)}}{\sqrt{d_v d_u}})$)→ GAT(加注意力权重)→ GraphSAGE(归纳式采样聚合,适合大规模图)。

补充 KG 推荐基础能力,隐性
causalforecastingrecommendationragknowledge_graphmulti_agent供应链与补货推荐与搜索知识图谱与RAGMAS与智能体工程

GraphRAG - 知识图谱增强检索生成

08-知识图谱

GraphRAG(Graph Retrieval-Augmented Generation) 将传统 RAG(检索增强生成)中的文本块检索升级为知识图谱结构化检索,通过图遍历获取与查询相关的实体、关系和子图,显著提升复杂推理场景的答案准确性和可解释性。

50-100万⭐⭐⭐⭐☆
forecastingoptimizationrecommendationragknowledge_graphpricing供应链与补货客服与VOC推荐与搜索知识图谱与RAG定价与利润

HGCN — 双曲图卷积网络

08-知识图谱

HGCN (Hyperbolic Graph Convolutional Networks) 解决传统 GNN 在欧氏空间中无法有效编码层次结构的问题。核心洞察:树状/层次化图结构(如品类树、组织架构)在欧氏空间中存在根本性的容量限制,而双曲空间天然适合表示层次关系。

⭐⭐⭐⭐☆
causalexperimentoptimizationrecommendationragknowledge_graphmulti_agentpricing推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润

HGT — 异构图 Transformer 表示学习

08-知识图谱

HGT (Heterogeneous Graph Transformer) 解决传统 GNN 无法处理异构图(节点和边有多种类型)的核心问题。传统 GNN 假设所有节点和边共享同一特征分布,这在电商场景(用户/产品/评论/属性共存)中完全不成立。

⭐⭐⭐⭐☆
causalexperimentoptimizationrecommendationragknowledge_graphmulti_agentpricing推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润

层级商品知识图谱自动构建(图片→KG)

08-知识图谱

零样本下用商品图片自动构建跨语种属性知识图谱:Schema 先行 → VLM 多轮萃取 → LLM 约束推理 → 层级扩展 → 程序化去重。建库成本与 SKU 数量线性解耦,无需人工标注模板。

0 万元⭐⭐⭐☆☆
causalexperimentforecastingknowledge_graphvisual_generation知识图谱与RAG风控与合规视觉内容生成

HyDE - 假设文档嵌入查询扩展

08-知识图谱

HyDE(Hypothetical Document Embeddings) 的洞察极其简单却有效

causalexperimentoptimizationragknowledge_graphdata_collection广告与投放推荐与搜索知识图谱与RAG数据采集与治理

稀疏+稠密混合检索 — BM25 与向量检索融合

08-知识图谱

母婴出海电商的搜索场景高度两极化:部分用户输入精确型号("Spectra S1 Plus"、"B07X4X5GXD"),纯向量检索因 OOV 问题召回率低;另一部分用户输入模糊语义查询("适合背奶妈妈的静音吸奶器"),纯 BM25 只能匹配字面词汇,无法理解意图

35 万
causalexperimentragknowledge_graph客服与VOC推荐与搜索知识图谱与RAG

知识图谱增强推荐 - CoLaKG (LLM × KG)

08-知识图谱

海外华人妈妈购买奶粉需综合考量品牌(HiPP/Aptamil)、成分(DHA/HMO 益生元)、段位(1段/2段)、认证(EU 有机/Non-GMO),传统 CF 无法解读这些维度

100-200 万元⭐⭐⭐☆☆
causalexperimentrecommendationknowledge_graph推荐与搜索知识图谱与RAG

AI Agent 驱动的电商知识图谱自动构建

08-知识图谱

传统知识图谱构建依赖人工定义 Schema 和编写抽取规则,成本高、扩展性差。AI Agent 驱动的 KG 自动构建 将全流程拆解为三个由 LLM Agent 协作完成的阶段,从非结构化产品描述中自动产出结构化知识图谱,无需预定义 Schema 或人工规则。

⭐⭐⭐☆☆
causalexperimentrecommendationragknowledge_graphmulti_agentpricing客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润

知识图谱增量更新(KG Incremental Update)

08-知识图谱

电商知识图谱的数据不是静态的——新品上架、价格调整、用户评论新增、竞品关系变化,每天都有大量三元组需要更新。若每次变更都触发全量 KG 重建,计算成本极高(百万节点 KG 重建需 4-8 小时)。增量更新(Incremental Update) 只处理变更的局部子图,将更新耗时压缩至秒级到分钟级。

causalexperimentrecommendationknowledge_graphpricing客服与VOC推荐与搜索知识图谱与RAG数据采集与治理定价与利润

KG-Powered User Profiling — 知识图谱驱动的用户画像:产品知识增强推荐

08-知识图谱

传统协同过滤仅依赖 user-item 矩阵,缺乏对产品语义的理解,导致跨品类推荐能力弱。KG-Powered User Profiling 通过异构图融合将产品知识图谱(属性/认证/成分/适用年龄段)与用户行为图(购买/浏览/评价)结合,构建知识增强的用户偏好向量。

跨品类推荐 CTR 提升 18%,用户 LTV 增加,冷启动转化率提升⭐⭐⭐☆☆
experimentrecommendationknowledge_graphpricing客服与VOC推荐与搜索知识图谱与RAG定价与利润

Knowledge Graph Relation Completion with CBLiP

08-知识图谱

母婴出海电商的商品知识图谱需要维护大量实体关系(品牌-产品、产品-成分、成分-功效、产品-适用年龄等)。

⭐⭐⭐☆☆
causalexperimentforecastingrecommendationknowledge_graph供应链与补货推荐与搜索知识图谱与RAG

Knowledge Graph Question Answering (KGQA)

08-知识图谱

构建了产品知识图谱后,如何让非技术人员(运营、客服、业务方)用自然语言查询它?

⭐⭐⭐☆☆
experimentforecastingrecommendationragknowledge_graphpricing客服与VOC推荐与搜索知识图谱与RAG定价与利润

Knowledge Graph for Skills Management(知识图谱驱动的技能管理)

08-知识图谱

知识图谱(Knowledge Graph, KG) 是一种用图结构表示知识的方法,通过实体-关系-实体的三元组形式(如"Uplift Modeling -应用于- 广告投放")将碎片化信息组织成可推理的知识网络。

⭐⭐⭐☆☆
causalexperimentforecastingoptimizationrecommendationknowledge_graphpricing广告与投放供应链与补货推荐与搜索知识图谱与RAG定价与利润

Multilingual Named Entity Recognition (Universal NER v2)

08-知识图谱

母婴出海电商的用户评论、客服对话、社交媒体内容涉及多语言(英语、德语、法语、西班牙语、日语等)。

⭐⭐☆☆☆
causalexperimentknowledge_graphmulti_agent客服与VOC推荐与搜索知识图谱与RAG数据采集与治理MAS与智能体工程

Multimodal RAG - 图文混合多模态检索增强生成

08-知识图谱

Multimodal RAG(多模态检索增强生成) 将 RAG 系统从纯文本扩展到图文混合模态,实现

causalexperimentragknowledge_graphvisual_generation客服与VOC推荐与搜索知识图谱与RAG视觉内容生成

领域 Ontology 与图谱 Schema 设计

08-知识图谱

知识图谱的 Schema(本体 / Ontology)是整个 KG 的"地图"——它定义了有哪些实体类型、有哪些关系、每个属性的值域和约束。Schema 质量直接决定下游 KGQA 的检索上限和 GraphRAG 的推理深度。母婴电商领域 Ontology 设计需要平衡覆盖率(覆盖所有业务场景)与可管理性(避免过度细化导致维护失控)。

causalexperimentragknowledge_graphpricing客服与VOC知识图谱与RAG定价与利润

检索后精排 — Cross-Encoder Reranking

08-知识图谱

RAG 管道的检索阶段(BM25/向量检索)优先保证召回率,会返回大量候选文档(top-50~100)。但这些候选文档与查询的相关性排序往往不准——召回阶段的 Bi-encoder 是独立编码查询和文档,无法捕捉两者间的细粒度交互。

28 万
causalexperimentoptimizationrecommendationragknowledge_graphmulti_agent客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程

RAPTOR - 递归抽象树型分层检索

08-知识图谱

RAPTOR(Recursive Abstractive Processing for Tree-Organized Retrieval) 将长文档转化为一棵"抽象树"

causalexperimentrecommendationragknowledge_graph广告与投放客服与VOC推荐与搜索知识图谱与RAG风控与合规

语义分块策略 — RAG 管道的基础层

08-知识图谱

母婴出海电商的 Amazon Listing 商品详情页通常包含多个话题段落:产品特性(Safety Features)、使用说明(How to Use)、注意事项(Warnings)、规格参数(Specifications)

18 万
causalexperimentragknowledge_graph客服与VOC推荐与搜索知识图谱与RAG

NL2Dashboard Automation(自然语言→仪表盘)

09-DataAgent-LLM

将自然语言分析需求自动转化为 BI 仪表盘(图表+指标卡片+筛选器)。NL→结构化查询→Chart DSL→渲染。核心:意图解析(trend/comparison/distribution/ranking)+ 自动图表类型选择。

节省 BI 开发人力
experimentforecastingoptimizationrecommendationragmulti_agentvisual_generation广告与投放供应链与补货推荐与搜索知识图谱与RAGMAS与智能体工程视觉内容生成

RAG-Enhanced Data Analysis(RAG 增强数据分析)

09-DataAgent-LLM

"为什么德国站吸奶器转化率下降"→ RAG 检索到上月分析"德国站转化率下降是因为欧元贬值导致价格上涨 8%"→本次发现同样模式→自动引用历史结论+实时数据验证

减少重复分析 50%,节省分析人力
causalexperimentforecastingragmulti_agentpricingvisual_generation供应链与补货推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润视觉内容生成

MemGPT — 长期记忆与虚拟上下文管理

10-MAS

MemGPT 将操作系统的虚拟内存管理思想引入 LLM Agent 的记忆系统。核心洞察:LLM 的上下文窗口就像物理 RAM——容量有限且昂贵,而 Agent 需要处理的任务往往远超这个容量。解决方案是构建一个分层记忆体系,让 LLM 主动管理自己的记忆。

⭐⭐⭐⭐☆
causalexperimentragknowledge_graphmulti_agentpricing客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润

AgenticPay — LLM 多 Agent 采购谈判:自主完成价格与 MOQ 协商

10-MAS

AgenticPay 将买卖双方谈判建模为三方博弈:Buyer Agent(代理买家利益)+ Seller Agent(代理卖家利益)+ Mediator Agent(协调双方找到 ZOPA)。LLM 驱动每个 Agent 根据各自的 BATNA(最佳替代方案)和策略参数自主生成报价、评估还价、决定让步幅度。

5 万元⭐⭐☆☆☆
causalexperimentforecastingoptimizationragmulti_agentpricing知识图谱与RAGMAS与智能体工程定价与利润

AutoGen — 多智能体对话编排框架

10-MAS

AutoGen 是一个通用的多智能体对话框架,核心洞察:将复杂的 LLM 应用开发简化为多 agent 之间的对话编排。不同于传统的单 agent 链式调用,AutoGen 允许多个具备不同能力的 agent 通过自然语言对话协作完成复杂任务。

⭐⭐⭐☆☆
causalexperimentoptimizationragmulti_agentpricing供应链与补货客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润

Flowr — 零售供应链多 Agent 端到端自动化

10-MAS

母婴品牌在亚马逊/独立站同时运营,SKU 达 500+,跨境仓(海外仓 + 国内直发)补货涉及 DHL/UPS 运输周期(15-30 天)、海关清关(3-7 天)、Amazon FBA 入仓(1-5 天),任何一环延误都导致断货(Lost Buy Box,单 SKU 日损失 2,000-8,000 元)

91 万元
causalexperimentforecastingoptimizationragmulti_agentpricing供应链与补货客服与VOC知识图谱与RAGMAS与智能体工程定价与利润

Helicase — 不确定性感知供应链知识图谱:多 Agent 自主构建

10-MAS

Helicase 是一个自主多 Agent LLM 系统,将高层供应链查询(如"某奶粉品牌的原料来源")分解为可执行调查计划,通过专业 Agent 协作增量构建带不确定性标注的知识图谱。名字来源于生物学的螺旋酶——螺旋式展开 DNA,隐喻系统通过迭代循环逐层揭示知识。

⭐⭐⭐☆☆
causalexperimentragknowledge_graphmulti_agent供应链与补货推荐与搜索知识图谱与RAGMAS与智能体工程风控与合规

LLM AutoBidding MAS — 大语言模型驱动的层次化自动竞价系统

10-MAS

诊断:用单一 LLM 直接生成竞价出价,会产生"竞价幻觉"——LLM 对价格的量化感知不准确,输出如 `$15.00`(实际均值 $0.80)的离谱出价。

⭐⭐⭐☆☆
causalexperimentoptimizationrecommendationragmulti_agentpricing广告与投放推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润

MAS Dynamic KG Collaboration — 多智能体动态知识图谱协同:实时构建、冲突解决、协同进化

10-MAS

`Skill-Helicase-Supply-Chain-KG-MAS` 解决的是"如何让 MAS 构建一个静态知识图谱"——一次性构建,然后查询。动态 KG 协同解决的是更难的问题:知识在持续演变,多个 Agent 同时读写 KG,如何保持 KG 的一致性、处理冲突、并让 KG 与 Agent 共同进化?

⭐⭐⭐☆☆
causalexperimentragknowledge_graphmulti_agentfraud_detectionpricing广告与投放知识图谱与RAGMAS与智能体工程定价与利润风控与合规

MAS Orchestrator — 多智能体编排与调度

10-MAS

MAS Orchestrator 是多 Agent 系统的"中枢神经系统",负责协调多个子 Agent 的执行顺序、数据流转、状态同步和错误恢复。核心洞察:分解后的子任务需要一个可靠的调度器来管理它们的生命周期——启动、监控、通信、容错、收尾。

⭐⭐⭐⭐☆
experimentoptimizationknowledge_graphmulti_agentvisual_generation客服与VOC知识图谱与RAGMAS与智能体工程视觉内容生成

MAS Resource Scheduling — OS 调度原语驱动的多智能体资源管理

10-MAS

MAS 生产化最常见的失败不来自 Agent 逻辑,而来自资源竞争:多个 Agent 并行调用同一个限速 API,导致连接重置、HTTP 502、上下文泄漏、Zombie Agent 挂起。这些问题在操作系统领域早已有成熟解法——HiveMind 和 AgentRM 把 OS 调度理论直接搬到 MAS 层。

12 万元⭐⭐☆☆☆
causalexperimentforecastingoptimizationknowledge_graphmulti_agentpricing供应链与补货知识图谱与RAGMAS与智能体工程定价与利润风控与合规

MAS Testing & Verification — 多智能体系统测试验证:覆盖制导 Fuzzing + 跨框架可观测性

10-MAS

MAS 的失败模式与单体软件完全不同:Agent 之间的交互是非确定性的,工具调用可能失败,Agent 可能陷入死循环,而这些问题用传统单元测试根本无法发现。MAS 专用测试体系需要解决三个独特问题

causalexperimentragmulti_agent广告与投放供应链与补货客服与VOC知识图谱与RAGMAS与智能体工程风控与合规

MetaGPT — SOP 驱动的多智能体协作框架

10-MAS

MetaGPT 将人类组织中的 Standardized Operating Procedures(SOP,标准作业程序) 引入多 agent 协作。核心洞察:复杂任务失败的主要原因是 agent 间缺乏标准化协作规范和结构化信息传递。通过模拟软件公司的角色分工(PM → Architect → Engineer → QA)和文档驱动的工作流,MetaGPT 显著减少了多 agent 协作中的幻觉和级联错误。

⭐⭐⭐⭐☆
causalexperimentragmulti_agentdata_collectionpricing客服与VOC知识图谱与RAG数据采集与治理MAS与智能体工程定价与利润

Multi-Agent Debate — 多智能体辩论共识

10-MAS

- LLM 生成初始答案后,即使答案错误,也会在后续反思中"维护"这个答案

⭐⭐⭐☆☆
causalexperimentoptimizationrecommendationragmulti_agentpricing客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润

ParaManager — 小模型主编排:Agent-as-Tool 并行子任务分解

10-MAS

Agent-as-Tool 协议统一:ParaManager 将传统系统中异构的 Agent(具有内部状态、多轮推理能力)和 Tool(无状态函数调用)统一为标准化的 `AgentAsTool` 接口。每个动作单元暴露相同的 `invoke(input) -> result` 接口,同时携带显式状态反馈(`status`, `progress`, `output`),让编排器无需了解底层实现差异即可统一调度。

⭐⭐☆☆☆
causalexperimentforecastingoptimizationknowledge_graphmulti_agentpricingvisual_generation广告与投放供应链与补货推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润风控与合规视觉内容生成

Model Evaluation Metrics(模型评估体系)

12-ML基础

模型评估体系解决"模型到底好不好"这个问题——不是凭感觉,而是用标准化的量化指标从多个维度衡量模型表现。这是所有预测建模的基础能力,也是 ML 工程中模型选型、A/B 测试结果判读、生产监控的必备技能。

5-8 万⭐⭐☆☆☆
causalexperimentforecastingrag广告与投放供应链与补货知识图谱与RAGMAS与智能体工程

Amazon ToS Compliance Guardrail(亚马逊合规护栏)

13-广告分析

LLM 在生成商品文案、广告文案、客服回复时可能无意间违反平台规则(医疗声明、安全认证、受限品类)。Compliance Guardrail 在 LLM 输出端建立三层过滤——从确定性规则匹配到风险评分到人工升级——确保所有面向亚马逊的内容合规。

5-10 万⭐⭐☆☆☆
causalexperimentrecommendationragmulti_agentfraud_detectionpricing广告与投放客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润风控与合规

CDA(Causal-Driven Attribution)— 无用户级数据的因果驱动归因

13-广告分析

核心思想:仅用聚合级别的每日广告曝光量与总订单数,无需任何 User ID 或 Cookie 追踪数据,通过时序因果图谱量化各渠道对转化的真实贡献比例。

⭐⭐☆☆☆
causalexperimentoptimizationrecommendationragmulti_agent广告与投放推荐与搜索知识图谱与RAGMAS与智能体工程

层次图神经网络跨设备用户匹配 - 无ID的跨端行为拼接

13-广告分析

将每台设备的 URL 访问序列 $\mathcal{S}_v = \{s_1, s_2, \ldots, s_n\}$ 构建为层次异构图

⭐⭐⭐⭐☆⭐⭐⭐☆☆
causalexperimentragmulti_agentvisual_generation广告与投放客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程风控与合规视觉内容生成

Identity Fragmentation Debiasing(身份碎片化纠偏)

13-广告分析

核心思想:用户在多设备间切换(手机看广告、电脑下单)导致底层 Cookie/IDFA 无法跨端串联,同一真实用户被拆分为多个"碎片化身份"。这使得广告平台看到的 ROAS 严重失真——有的记录"只有曝光没有购买",有的记录"只有购买没有广告"。算法通过 Stratified Aggregation(分层聚合) 在 Cohort 层面重建真实曝光与购买的对应关系,无需跨设备图谱,还原因果 ROI。

⭐⭐☆☆☆
causalexperimentoptimizationrag广告与投放知识图谱与RAG风控与合规

PersonaBot RAG画像生成 - LLM+RAG驱动的客户画像落地工具

14-用户分析

Momcozy 在 Amazon US 的 S9/S12 系列累积数万条评论,但产品团队只能依赖人工抽查了解用户诉求,无法识别"职场背奶妈妈"与"新手妈妈"在痛点上的差异,导致广告文案和详情页对所有人说同样的话,转化率损耗严重 - 数据要求: - Amazon Review 数据(user_id、product_id、评论文本、评分、时间戳),CSV 格式 - 数量:每 SKU ≥ 50

20-40 万元⭐⭐☆☆☆
causalexperimentrag广告与投放客服与VOC推荐与搜索知识图谱与RAG

DARA Agentic MMM — LLM Agent 驱动的营销组合建模:双阶段自动调参与智能归因

15-营销投放分析

某母婴辅食品牌在美国市场同时投放 Amazon Ads、Meta(FB+IG)、TikTok,月均广告预算 $15 万美元,但各渠道的 adstock 效应差异显著(TikTok 内容影响力可持续 2-4 周,Amazon 关键词效果衰减快)

30-60 万⭐⭐⭐☆☆
causalexperimentoptimizationrecommendationragmulti_agent广告与投放推荐与搜索知识图谱与RAGMAS与智能体工程

EComStage — 电商 Agent 三阶段(Perception/Planning/Action)双向 Benchmark

16-智能体工程

EComStage 解决现有 e-commerce benchmark 只看"最终任务是否成功"的盲点。它把 LLM Agent 的推理过程分解为三阶段评估,并首次同时覆盖 customer-oriented 和 merchant-oriented 两类视角

⭐⭐⭐☆☆
experimentoptimizationrecommendationragmulti_agent客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程

AgentTrace — 因果图根因分析:0.12s 定位多 Agent 故障

16-智能体工程

AgentTrace 的核心洞察是:多 Agent 系统(MAS)的故障传播是确定性的因果链,而非需要 LLM 进行语义推理的模糊问题。

5-20 万⭐⭐☆☆☆
causalexperimentforecastingragmulti_agentdata_collection供应链与补货客服与VOC知识图谱与RAG数据采集与治理MAS与智能体工程

AgeMem — 统一 LTM+STM 管理的 Agentic Memory

16-智能体工程

AgeMem(Agentic Memory) 颠覆了传统 LTM/STM 分离架构,把记忆管理整合到 Agent 的 policy 本身。现有方法把 LTM 与 STM 当作两个独立模块,要么用 trigger-based 启发式,要么外挂 Memory Manager,导致

STM Filter + Summary 让对话 context 维持紧凑⭐⭐⭐⭐☆
causalexperimentoptimizationrecommendationragknowledge_graphmulti_agent广告与投放客服与VOC推荐与搜索知识图谱与RAG数据采集与治理MAS与智能体工程

SkillForge — 领域特定自演化 Agent Skill 萃取与优化

16-智能体工程

母婴出海跨境客服 1 单可能涉及 10+ 国家、5+ 平台(Shopify/Amazon/TikTok Shop/独立站)、30+ 产品类目,人工写 SOP 速度跟不上业务扩张

bad case 自动诊断省去人工质检 30%-50% 工时⭐⭐⭐⭐☆
causalexperimentoptimizationknowledge_graphmulti_agent广告与投放客服与VOC知识图谱与RAGMAS与智能体工程

AutoSkill — 经验驱动终身学习:Skill 自进化版本管理

16-智能体工程

RAG 的局限:被动检索,只能复用已显式存入的知识,无法从对话轨迹中自动归纳模式;Fine-tuning 的局限:参数固化后无法增量更新,每次新能力都需全量重训,知识以黑盒形式埋在权重里,不可审计不可编辑。

⭐⭐⭐☆☆
causalexperimentragmulti_agent广告与投放供应链与补货客服与VOC知识图谱与RAG数据采集与治理MAS与智能体工程

CASCADE — 案例推理部署时学习:Contextual Bandit 无参数自适应

16-智能体工程

部署时学习(Deployment-Time Learning, DTL) 是 CASCADE 提出的第三个 LLM 生命周期阶段:预训练(Pre-training)→ 微调(Fine-tuning)→ 部署时学习。现有方案只在前两个阶段学习,部署后模型冻结,无法从实际使用中积累经验。

⭐⭐☆☆☆
causalexperimentoptimizationrecommendationragmulti_agent广告与投放客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程

Shopping Companion — 记忆增强的长期偏好购物 Agent

16-智能体工程

Shopping Companion 解决两个长期被忽视的问题:(1) 缺少能评估跨 session 偏好记忆的端到端购物 benchmark;(2) 现有方法把"偏好识别"和"购物执行"当作独立模块,没有端到端联合优化。它把购物 Agent 形式化为 POMDP,并提出两阶段统一框架 + 双奖励 RL 训练。

⭐⭐⭐⭐☆
experimentoptimizationrecommendationragmulti_agentpricing广告与投放供应链与补货客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润

MCP + A2A 双协议栈 — Orchestrated Multi-Agent 企业架构

16-智能体工程

The Orchestration of Multi-Agent Systems 把 LLM Agent 系统的演化分三阶段:单 Agent → 松耦合多 Agent → orchestrated 多 Agent。论文的核心贡献是把"orchestration"形式化为四层架构 + 两类协议

⭐⭐⭐⭐☆
experimentragmulti_agentvisual_generation广告与投放客服与VOC推荐与搜索知识图谱与RAG数据采集与治理MAS与智能体工程风控与合规视觉内容生成

SoK Agentic Skills — Agent Skill 全生命周期与方法论底座

16-智能体工程

SoK Agentic Skills(Systematization of Knowledge)是 Agent Skill 领域第一篇综合 survey,把分散在 Voyager / CodeAct / Reflexion / Claude Skills / GPT Store / MCP 等系统中的"Skill 概念"统一为一个理论框架。它解决三个根本问题

⭐⭐⭐☆☆
causalexperimentrecommendationragknowledge_graphmulti_agent供应链与补货客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程

MCP Tool 描述质量审核 — 六维 Smell 扫描与动态路由

16-智能体工程

Queen's University 2026 年的大规模实证研究揭示:97.1% 的 MCP tool 描述至少含有一个 smell,这些描述缺陷直接导致 FM 选错工具、传错参数或产生不必要的交互步骤。论文提出六维评分 rubric + 动态组件路由,在提升 agent 准确率 (+5.85pp) 的同时控制 token 开销 (+67.46% steps 的 trade-off)。

⭐⭐⭐☆☆
causalexperimentoptimizationrecommendationragmulti_agent供应链与补货客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程风控与合规

DS-DGA-GCN — 动态图假评论群组检测:冷启动新品防刷评

19-风控反欺诈

核心思想:在"产品 → 评论 → 评论者"三方动态异构图上检测刷评团伙群组。不看单条评论文本质量,而是看评论者之间的网络行为模式——真实用户构成稀疏随机网络,刷评团伙则共现密集、行为高度同步。

⭐⭐⭐☆☆
causalexperimentknowledge_graphfraud_detection客服与VOC知识图谱与RAG风控与合规

Review Fraud Detection(虚假评论检测)

19-风控反欺诈

GNN 图神经网络检测虚假评论——不是看单条评论文本,而是看评论者-产品-评分之间的关系图。虚假评论团通常呈现异常图模式:同批次账号、评分极端(1 或 5 星)、评论时间集中、文本相似度高。

5-15 万元⭐⭐⭐☆☆
causalknowledge_graphmulti_agentfraud_detection客服与VOC知识图谱与RAGMAS与智能体工程风控与合规

BrandFusion — Multi-Agent Brand Integration(品牌无缝植入视频)

20-AI视频生成

用 AI 生成品牌视频时,品牌 Logo/包装/视觉资产在视频中会变形、消失或被遮挡。

50-80 万元
causalexperimentforecastingoptimizationknowledge_graphmulti_agentvisual_generation广告与投放供应链与补货知识图谱与RAG数据采集与治理MAS与智能体工程视觉内容生成

Phantom — Product Showcase I2V(商品主体一致性视频生成)

20-AI视频生成

输入 1-3 张商品参考图,生成商品保持外观一致性的动态展示视频——商品 Logo、纹理、颜色在视频全程不畸变。这解决了通用 I2V 模型的致命伤:生成视频时商品外观逐渐漂移("copy-paste"信息泄露问题)。

50 万⭐⭐⭐☆☆
causalexperimentrecommendationknowledge_graphvisual_generation广告与投放推荐与搜索知识图谱与RAG数据采集与治理视觉内容生成

Document Intelligence Parsing — LLM 驱动的文档智能解析:图文统一 OCR、跨页表格恢复、布局感知推理

22-数据采集工程

供应商发来的报价单是 PDF,工厂产能表是 Excel 截图,海关 HS 编码文件是扫描件——这些"已有但不可用"的数据是母婴跨境电商最大的数据孤岛。传统 OCR(Tesseract)只能识别文字,无法理解表格结构、跨页截断、图文混排。

⭐⭐☆☆☆
causalexperimentforecastingoptimizationragdata_collectionpricingvisual_generation推荐与搜索知识图谱与RAG数据采集与治理定价与利润风控与合规视觉内容生成