01-因果推断
共形预测的核心保证:共形预测(Conformal Prediction, CP)在无需分布假设的条件下,为任意黑盒预测模型提供覆盖率理论保证。对于置信水平 1-α(如 90%),输出的预测区间 `[lower, upper]` 在有限样本下满足:`P(y ∈ [lower, upper]) ≥ 1-α`。这一保证来自数据可交换性(exchangeability),而非 Gaussian 分布假设。
⭐⭐☆☆☆
causalexperimentforecastingmulti_agentfraud_detection广告与投放供应链与补货MAS与智能体工程风控与合规
04-供应链
FSDA-DRL(Fast-Slow Dual-Agent Deep Reinforcement Learning)用两个独立的 RL 智能体,在不同时间频率上分别解决"定价"(快决策)和"补货"(慢决策)问题,并通过共享环境状态让它们协作而非博弈。
5000 万元⭐⭐⭐☆☆
causalexperimentforecastingoptimizationmulti_agentfraud_detectionpricing广告与投放供应链与补货MAS与智能体工程定价与利润风控与合规
04-供应链
母婴跨境海运提前期(Lead Time, LT)在 25-50 天剧烈波动(苏伊士事件/港口拥堵). 传统安全库存假设 LT 固定,实际服务水平远低于设定值(设 95% 实际只有 85%). Gen-QOT 用深度自回归生成模型对 LT 进行分布式建模(不假设参数分布),并把"订单整批到货"扩展为分批随机到达(QOT, Quantity-Over-Time),精确建模拼箱拆批到港行为. 动态安全库存自适应季节性 + 港口拥堵期.
200-500 万/年⭐⭐⭐⭐☆
causalexperimentforecastingfraud_detection供应链与补货风控与合规
04-供应链
吸奶器在 Amazon FBA 仓缺货(销量超预期),但独立站海外仓还有 200 件积压,TikTok Shop 也在慢速消化——三渠道信息不互通,总库存 800 件却出现"某渠道缺货 + 某渠道积压"
200-400 万元⭐⭐⭐☆☆
causalexperimentforecastingoptimizationfraud_detection广告与投放供应链与补货推荐与搜索风控与合规
04-供应链
在一个从工厂到终端消费者的多层级供应链网络中,决定在哪里建哪类设施、各层级之间如何连通,使全链路固定成本和运输成本之和最小。
1000 万⭐⭐⭐☆☆
causalexperimentforecastingoptimizationrecommendationfraud_detection广告与投放供应链与补货推荐与搜索风控与合规
04-供应链
核心思想:把"建哪些仓"和"怎么配送"这两个原本耦合的 NP-hard 问题解耦——用一个预训练好的图神经网络(GNN)充当配送路径成本的快速估计器,把估计值直接嵌进选址的混合整数规划(MIP)里,从而让 MIP 求解器只需要做高层选址-分配决策,而不必在求解过程中展开庞大的车辆路径(VRP)变量。
91 万元⭐⭐⭐☆☆
causalforecastingoptimizationfraud_detection广告与投放供应链与补货客服与VOCMAS与智能体工程风控与合规
04-供应链
如何仅凭历史离线日志(无需在线试错),找出使总期望收益最大化的商品展示组合。
15-30 万元⭐⭐⭐☆☆
causalexperimentforecastingoptimizationrecommendationragfraud_detectionpricing供应链与补货推荐与搜索知识图谱与RAG定价与利润风控与合规
04-供应链
PPO-swap 解决的是在真实道路网络(加权图)上,如何快速决定把哪个仓库/站点搬去哪里,使全局配送成本最低。传统 Gurobi 在大图上算不动(千节点场景需数小时),贪心启发式又容易陷入局部最优。PPO-swap 以"从初始布局出发、反复微调"取代"从零开始构建",每一步只做一次交换(Swap):关掉一个现有设施,在另一个节点重开,直到整体成本无法再降。
70-100 万元
causalforecastingoptimizationmulti_agentfraud_detection供应链与补货MAS与智能体工程风控与合规
05-推荐系统
传统推荐系统是单一模型的端到端优化,难以整合多维用户意图(价格敏感、品牌偏好、安全认证关注)。MAS Collaborative Recommendation 将推荐任务分解为多个专业化 LLM Agent 的协作问题
⭐⭐⭐⭐☆
causalexperimentforecastingoptimizationrecommendationragmulti_agentpricing广告与投放供应链与补货推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润风控与合规
06-增长模型
跨境电商的致命问题:70-80% 商品在目标市场无历史数据,15-25% 上架后零销量,但传统预测模型会给出"看起来合理"的正数预测→导致库存积压。ZODIAC 用双域 LSTM + 双头架构同时解决"零销量预测"和"过预测"两个核心痛点。
60-120 万元⭐⭐⭐☆☆
causalexperimentforecastingrecommendationfraud_detectionpricing供应链与补货客服与VOC推荐与搜索定价与利润风控与合规
06-增长模型
识别哪些用户即将停止使用产品/服务,从而提前采取挽留措施。
1.5-3 万⭐⭐☆☆☆
causalexperimentforecastingfraud_detection客服与VOC风控与合规
06-增长模型
母婴订阅盒服务(如每月奶粉+尿布套餐)面临用户流失风险
100 万⭐⭐⭐☆☆
causalexperimentforecastingoptimizationfraud_detection客服与VOC风控与合规
06-增长模型
在新商品上市前预测其成功概率,从而优化选品决策和资源配置。
500万
causalexperimentforecastingoptimizationpricing供应链与补货客服与VOC定价与利润风控与合规
06-增长模型
1. 市场规模(搜索量 + BSR 品类总量,$w$=0.25)
40-80 万元⭐⭐☆☆☆
causalforecastingpricing供应链与补货数据采集与治理定价与利润风控与合规
06-增长模型
多准则决策(MCDM)——TOPSIS 方法评估供应商。综合质量、价格、交期、合规、沟通五个维度。
15-25 万元⭐⭐☆☆☆
pricing数据采集与治理定价与利润风控与合规
06-增长模型
独立站每天面对来自北美高净值用户(iPhone + 5分钟停留)和东南亚价格敏感用户(安卓 + 10秒跳出)的混合流量
500万⭐⭐☆☆☆
causalexperimentforecastingoptimizationpricing广告与投放供应链与补货客服与VOC定价与利润风控与合规
08-知识图谱
大促高峰期每日 5 万条跨领域工单,正确路由率从 61% → 82%,每天减少约 10,500 条二次转单 - 单条转单处理成本约 5 元,节约运营成本 5.25 万元/天;年化 1900 万元 - 用户 CSAT 评分从 3.8 → 4.3(满分 5),复购意愿提升可观
1900 万元⭐⭐⭐☆☆
causalrecommendationragknowledge_graphmulti_agentfraud_detectionpricing广告与投放客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润风控与合规
08-知识图谱
手动 ERP 排查可能要 2-3 周,到时候竞争对手早把备货扫空了
50-200 万元⭐⭐⭐☆☆
causalknowledge_graphmulti_agentfraud_detection供应链与补货知识图谱与RAGMAS与智能体工程风控与合规
08-知识图谱
传统 RAG 将文档切分为固定长度的 chunk,导致原本有完整因果逻辑的段落被割裂。例如"产品A未通过认证 → 被召回 → 触发贸易禁令"这一因果链横跨多个 chunk,单个 chunk 无法表达完整逻辑。
⭐⭐⭐☆☆
causalexperimentragknowledge_graph推荐与搜索知识图谱与RAG风控与合规
08-知识图谱
用户反馈"机器转了两圈突然停下并闪红灯",传统 FAQ 机器人把所有带"红灯"的内容(充电时亮红灯/故障码等)全部返回,答非所问,最终用户申请退货
120-200 万元
causalrecommendationragknowledge_graphmulti_agentfraud_detection供应链与补货客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程风控与合规
08-知识图谱
零样本下用商品图片自动构建跨语种属性知识图谱:Schema 先行 → VLM 多轮萃取 → LLM 约束推理 → 层级扩展 → 程序化去重。建库成本与 SKU 数量线性解耦,无需人工标注模板。
0 万元⭐⭐⭐☆☆
causalexperimentforecastingknowledge_graphvisual_generation知识图谱与RAG风控与合规视觉内容生成
08-知识图谱
RAPTOR(Recursive Abstractive Processing for Tree-Organized Retrieval) 将长文档转化为一棵"抽象树"
causalexperimentrecommendationragknowledge_graph广告与投放客服与VOC推荐与搜索知识图谱与RAG风控与合规
09-DataAgent-LLM
母婴出海电商客服 70% 工单是"退换货咨询"(尺码错、漏发、过敏等),人工处理成本高,响应慢
600 万元⭐⭐⭐☆☆
experimentrecommendationmulti_agent客服与VOC推荐与搜索MAS与智能体工程风控与合规
09-DataAgent-LLM
挑战一:跨单元格推理(Cross-Cell Reasoning)
⭐⭐☆☆☆
causalexperimentragmulti_agentpricingvisual_generation供应链与补货推荐与搜索知识图谱与RAG数据采集与治理MAS与智能体工程定价与利润风控与合规视觉内容生成
09-DataAgent-LLM
当 GMV 暴跌时,传统监控会同时弹出几百个警报——流量跌、加购跌、结账跌、支付跌……却不告诉你哪个是起因,哪个是被牵连的。
100 万⭐⭐☆☆☆
causalexperimentforecastingmulti_agentfraud_detectionpricingvisual_generation广告与投放供应链与补货客服与VOCMAS与智能体工程定价与利润风控与合规视觉内容生成
10-MAS
Agent Q-Mix 将多 Agent 系统的通信拓扑选择建模为多智能体强化学习(MARL)问题:每个 Agent 在每个时间步从 6 种通信动作中选择一个,整个系统通过 QMIX 值分解联合优化,学习"哪些 Agent 需要相互通信、何时通信、用何种方式通信"。
5-10 万⭐⭐⭐☆☆
causalexperimentoptimizationmulti_agent供应链与补货MAS与智能体工程风控与合规
10-MAS
静态工具注册(配置文件写死 Agent 列表)无法应对 MAS 三大动态性:① Agent 数量动态扩缩;② 能力随版本演化;③ 健康状态实时变化(宕机/过载/SLO 降级)。
⭐⭐⭐☆☆
causalexperimentforecastingmulti_agentpricing供应链与补货MAS与智能体工程定价与利润风控与合规
10-MAS
MCP(Model Context Protocol):解决 Agent 与工具/数据源的连接(Host ↔ Server)
⭐⭐⭐⭐☆
causalexperimentoptimizationmulti_agentpricing广告与投放供应链与补货数据采集与治理MAS与智能体工程定价与利润风控与合规
10-MAS
静态 DAG 的局限:传统工作流引擎(Airflow、Prefect 等)要求在运行前确定完整的 DAG 拓扑。一旦启动,节点集合与依赖边均固定,无法根据中间执行结果裁剪冗余分支或插入新必要节点。当业务逻辑含有"发现 A 就不需要 B"或"发现 C 就需要新增 D"的条件语义时,静态 DAG 只能用 stub 节点 + 空操作变通,徒增图复杂度。
⭐⭐⭐☆☆
causalexperimentforecastingoptimizationmulti_agent供应链与补货MAS与智能体工程定价与利润风控与合规
10-MAS
EvoSC(Self-Consolidation for Self-Evolving Agents,arXiv 2602.01966,2026年2月)解决了现有 Agent 自我进化框架的两个根本缺陷
⭐⭐⭐☆☆
causalexperimentrecommendationmulti_agent广告与投放客服与VOC推荐与搜索MAS与智能体工程风控与合规
10-MAS
传统 LLM Multi-Agent System(MAS)中,Agent 之间通过自然语言传递信息。
⭐⭐⭐☆☆
causalexperimentforecastingmulti_agentvisual_generation供应链与补货MAS与智能体工程风控与合规视觉内容生成
10-MAS
Helicase 是一个自主多 Agent LLM 系统,将高层供应链查询(如"某奶粉品牌的原料来源")分解为可执行调查计划,通过专业 Agent 协作增量构建带不确定性标注的知识图谱。名字来源于生物学的螺旋酶——螺旋式展开 DNA,隐喻系统通过迭代循环逐层揭示知识。
⭐⭐⭐☆☆
causalexperimentragknowledge_graphmulti_agent供应链与补货推荐与搜索知识图谱与RAGMAS与智能体工程风控与合规
10-MAS
`Skill-Multi-Agent-Debate` 解决的是"如何让多个 Agent 通过辩论收敛到更好的答案"——这是非正式共识。MAS 共识机制解决的是更严格的问题:在部分 Agent 可能失败或说谎(Byzantine 容错)的情况下,如何保证整个系统仍能达成一致且正确的决策,并有数学证明?
200-500 万⭐⭐☆☆☆
causalexperimentmulti_agent广告与投放供应链与补货MAS与智能体工程风控与合规
10-MAS
`Skill-Helicase-Supply-Chain-KG-MAS` 解决的是"如何让 MAS 构建一个静态知识图谱"——一次性构建,然后查询。动态 KG 协同解决的是更难的问题:知识在持续演变,多个 Agent 同时读写 KG,如何保持 KG 的一致性、处理冲突、并让 KG 与 Agent 共同进化?
⭐⭐⭐☆☆
causalexperimentragknowledge_graphmulti_agentfraud_detectionpricing广告与投放知识图谱与RAGMAS与智能体工程定价与利润风控与合规
10-MAS
MAS 中 Agent 之间传递消息,但消息的可信度并不相同——某个 Agent 可能已被攻击者控制(Sleeper Agent),在积累足够信任后才触发恶意行为。动态信任管理解决的问题是:在没有可信第三方的情况下,每个 Agent 如何评估其他 Agent 发来消息的可信度,并据此决定接受或拒绝。
5-30 万元⭐⭐☆☆☆
experimentforecastingmulti_agentpricing供应链与补货推荐与搜索MAS与智能体工程定价与利润风控与合规
10-MAS
MAS 生产化最常见的失败不来自 Agent 逻辑,而来自资源竞争:多个 Agent 并行调用同一个限速 API,导致连接重置、HTTP 502、上下文泄漏、Zombie Agent 挂起。这些问题在操作系统领域早已有成熟解法——HiveMind 和 AgentRM 把 OS 调度理论直接搬到 MAS 层。
12 万元⭐⭐☆☆☆
causalexperimentforecastingoptimizationknowledge_graphmulti_agentpricing供应链与补货知识图谱与RAGMAS与智能体工程定价与利润风控与合规
10-MAS
1. 性能坍塌问题:新 Agent 加入时,系统路由还不了解其能力,导致任务分配混乱、性能下降
⭐⭐⭐☆☆
experimentoptimizationmulti_agent广告与投放供应链与补货客服与VOCMAS与智能体工程风控与合规
10-MAS
MAS 的失败模式与单体软件完全不同:Agent 之间的交互是非确定性的,工具调用可能失败,Agent 可能陷入死循环,而这些问题用传统单元测试根本无法发现。MAS 专用测试体系需要解决三个独特问题
causalexperimentragmulti_agent广告与投放供应链与补货客服与VOC知识图谱与RAGMAS与智能体工程风控与合规
10-MAS
Agent-as-Tool 协议统一:ParaManager 将传统系统中异构的 Agent(具有内部状态、多轮推理能力)和 Tool(无状态函数调用)统一为标准化的 `AgentAsTool` 接口。每个动作单元暴露相同的 `invoke(input) -> result` 接口,同时携带显式状态反馈(`status`, `progress`, `output`),让编排器无需了解底层实现差异即可统一调度。
⭐⭐☆☆☆
causalexperimentforecastingoptimizationknowledge_graphmulti_agentpricingvisual_generation广告与投放供应链与补货推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润风控与合规视觉内容生成
10-MAS
SDOF 将 Multi-Agent System(MAS)的执行流程建模为有限状态机(FSM),通过双层防护机制确保 Agent 行为的合法性。
⭐⭐⭐☆☆
causalexperimentforecastingoptimizationmulti_agent广告与投放供应链与补货MAS与智能体工程风控与合规
11-AI人文
钩子(Hook) → 冲突(Conflict) → 解决(Resolution) → 行动召唤(CTA)
⭐⭐☆☆☆
causalexperimentoptimization广告与投放客服与VOC推荐与搜索数据采集与治理风控与合规
11-AI人文
AI 系统必须在用户可感知的层面说明"你在和一个 AI 交互"。FTC 2023 年指南明确要求:AI 客服首条消息必须声明身份;AI 生成内容必须标注。母婴场景额外要求:当 AI 给出健康/营养建议时,必须附注"请咨询儿科医生"。
⭐⭐☆☆☆
experimentrecommendationmulti_agent广告与投放供应链与补货客服与VOC推荐与搜索MAS与智能体工程风控与合规
11-AI人文
母婴高风险购买决策(奶粉品牌、安全座椅、辅食选择)的特点是:消费者需要理由才能信任推荐。研究表明,在高风险品类中,"不知道为什么推荐"比"不推荐"更会降低购买意愿。黑盒 AI 推荐的三个信任障碍
⭐⭐☆☆☆
causalexperimentrecommendationmulti_agentfraud_detectionpricing广告与投放推荐与搜索MAS与智能体工程定价与利润风控与合规
11-AI人文
AI 生成文本与人类写作在统计层面存在系统性差异,可通过以下三类特征加以量化鉴别
⭐⭐☆☆☆
experimentforecastingmulti_agentfraud_detection供应链与补货客服与VOCMAS与智能体工程风控与合规
13-广告分析
LLM 在生成商品文案、广告文案、客服回复时可能无意间违反平台规则(医疗声明、安全认证、受限品类)。Compliance Guardrail 在 LLM 输出端建立三层过滤——从确定性规则匹配到风险评分到人工升级——确保所有面向亚马逊的内容合规。
5-10 万⭐⭐☆☆☆
causalexperimentrecommendationragmulti_agentfraud_detectionpricing广告与投放客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润风控与合规
13-广告分析
将每台设备的 URL 访问序列 $\mathcal{S}_v = \{s_1, s_2, \ldots, s_n\}$ 构建为层次异构图
⭐⭐⭐⭐☆⭐⭐⭐☆☆
causalexperimentragmulti_agentvisual_generation广告与投放客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程风控与合规视觉内容生成
13-广告分析
核心思想:用户在多设备间切换(手机看广告、电脑下单)导致底层 Cookie/IDFA 无法跨端串联,同一真实用户被拆分为多个"碎片化身份"。这使得广告平台看到的 ROAS 严重失真——有的记录"只有曝光没有购买",有的记录"只有购买没有广告"。算法通过 Stratified Aggregation(分层聚合) 在 Cohort 层面重建真实曝光与购买的对应关系,无需跨设备图谱,还原因果 ROI。
⭐⭐☆☆☆
causalexperimentoptimizationrag广告与投放知识图谱与RAG风控与合规
13-广告分析
某母婴品牌每月新品 8-12 个 SKU,人工撰写一套完整 Listing(标题+5条Bullet+描述+后台ST)需要 2-3 小时/SKU,月均耗时 20-30 小时
18-192 万元⭐⭐☆☆☆
causalexperimentforecastingoptimization广告与投放客服与VOC数据采集与治理风控与合规
13-广告分析
核心思想:把 Amazon Listing 的「吸引力」分解为文本质量 + 图像质量两个可量化维度,用神经网络预测每个内容位置(标题/主图/描述/bullet points)对转化成功率的贡献,并反向输出"改哪里能提升最多"的可操作建议。
⭐⭐☆☆☆
experimentforecastingoptimizationrecommendationpricingvisual_generation广告与投放客服与VOC推荐与搜索数据采集与治理定价与利润风控与合规视觉内容生成
13-广告分析
传统 CVR(转化率)模型只建模"点击→购买",忽略退款行为,导致
100 万⭐⭐⭐☆☆
causalexperimentforecastingoptimizationrecommendationpricing广告与投放推荐与搜索定价与利润风控与合规
14-用户分析
用户上月购买了 Stage 1 奶粉,系统推断宝宝约 2-3 月龄
50 万⭐⭐☆☆☆
causalexperimentrecommendationmulti_agentdata_collectionpricing客服与VOC推荐与搜索数据采集与治理MAS与智能体工程定价与利润风控与合规
15-营销投放分析
传统多触点归因(Multi-Touch Attribution, MTA)依赖用户级点击路径数据:追踪每个用户从广告曝光→点击→转化的完整旅程,才能判断各渠道贡献。
⭐⭐⭐☆☆
causalexperimentforecastingoptimization广告与投放风控与合规
15-营销投放分析
Facebook 月预算从 $5 万加到 $8 万后,ROAS 从 3.2 掉到 2.1
18-25 万元⭐⭐☆☆☆
causalexperimentoptimization广告与投放客服与VOC推荐与搜索风控与合规
15-营销投放分析
匿名访客(未授权追踪)向 AI 助手提问穿搭,传统推荐因无 Cookie 完全失效,品牌白白流失高意图实时流量 - 数据要求:用户自然语言查询文本 + SKU 库(含品类、场景标签、图片描述)+ 广告主实时出价 - GenAI 方案: - 用户问:"我下周去海边参加婚礼,梨形身材,有什么建议
15 万⭐⭐☆☆☆
causalexperimentforecastingoptimizationrecommendationmulti_agentfraud_detectionpricing广告与投放供应链与补货客服与VOC推荐与搜索MAS与智能体工程定价与利润风控与合规
15-营销投放分析
CMO 拿到内部 MMM 报告,显示"TikTok ROAS 极高远未饱和,建议把 Meta 预算砍半全移给 TikTok"
1000 万元⭐⭐☆☆☆
causalexperimentforecastingoptimizationfraud_detection广告与投放定价与利润风控与合规
15-营销投放分析
营销归因的核心难题是数据孤岛:广告平台(Meta/Google/TikTok)、CRM(Salesforce/HubSpot)、电商平台(Amazon/Shopify)、社交媒体各持一方数据,无法直接关联。数据管道需要解决
12 万⭐⭐⭐⭐☆
causalexperimentdata_collection广告与投放数据采集与治理风控与合规
15-营销投放分析
基于营销投放数据提前 3-7 天预测物流需求峰值,驱动仓储/运力的前置性扩容决策。
20-40 万⭐⭐⭐☆☆
causalexperimentforecastingfraud_detection广告与投放供应链与补货风控与合规
16-智能体工程
Focus 借鉴 Physarum polycephalum(多头绒泡菌,俗称粘菌)的探索-收缩策略,把 LLM agent 从被动 "append-only" 模式升级为主动 "explore → compress → withdraw" 模式
⭐⭐⭐☆☆
causalexperimentmulti_agentpricing客服与VOCMAS与智能体工程定价与利润风控与合规
16-智能体工程
AgeMem 是首个将 LTM(长期记忆)和 STM(短期记忆)统一到 Agent Policy 的端到端框架。传统方案把两种记忆当作独立模块,由外置 Memory Manager 或启发式 trigger 决策,导致组合效果差、部署成本高(需要额外 expert LLM)。AgeMem 的突破在于:记忆操作本身就是 action,由同一个 LLM policy 通过 RL 学习"何时调什么"。
10 万⭐⭐⭐☆☆
causalexperimentoptimizationmulti_agentpricing广告与投放客服与VOC推荐与搜索MAS与智能体工程定价与利润风控与合规
16-智能体工程
WF-D 选品扫描工作流中,AI 导购 Agent 根据母婴产品描述为用户推荐商品
5000 万⭐⭐☆☆☆
causalexperimentrecommendationmulti_agent客服与VOC推荐与搜索MAS与智能体工程风控与合规
16-智能体工程
传统 pass@1 仅衡量"至少一次成功",无法反映 Agent 在生产环境的持续可靠性。Agent 可靠性需要三层 SLI 互补
⭐⭐☆☆☆
experimentrecommendationmulti_agent广告与投放供应链与补货推荐与搜索数据采集与治理MAS与智能体工程风控与合规
16-智能体工程
LLM Agent 面临 Prompt Injection、Jailbreak、工具误用等安全风险。三层防护:(1) 输入过滤——检测注入模式;(2) 工具调用前置验证——参数白名单+范围检查;(3) 输出审计——敏感信息脱敏。
10-30 万元⭐⭐☆☆☆
experimentoptimizationmulti_agent客服与VOC推荐与搜索MAS与智能体工程风控与合规
16-智能体工程
为什么基础设施沙箱不足:容器/seccomp 工作在系统调用层,不理解语义。例如 `rm -rf /tmp/orders/` 在文件系统层完全合法,但在补货 Agent 上下文中是灾难性操作。AgentTrust 在工具调用层工作,理解"操作意图"而非仅检查"操作权限"。
20-60 万元⭐⭐☆☆☆
causalexperimentmulti_agentfraud_detection供应链与补货客服与VOCMAS与智能体工程风控与合规
16-智能体工程
每日需要上架数百个 SKU,每个 SKU 经过「标题优化→图片描述生成→合规检查→关键词填写」4 步 SOP,当前用 LangGraph 编排,frontier 模型成本约 $0.15/SKU × 1000 SKU = $150/天
$150/天 → 约 $0.5–1.2/天(按 128–462× 节省比例)
causalexperimentoptimizationmulti_agentvisual_generation广告与投放客服与VOCMAS与智能体工程风控与合规视觉内容生成
16-智能体工程
CausalFlow 将 Agent 的一次执行视为有序步骤序列
⭐⭐⭐☆☆
causalexperimentforecastingoptimizationmulti_agent广告与投放供应链与补货MAS与智能体工程风控与合规
16-智能体工程
语言翻译是跨境电商的最低门槛,真正影响转化的是文化适配:同一款婴儿奶粉,美国妈妈关注"科学配方/AAP认证",德国妈妈关注"有机/欧盟标准",日本妈妈关注"安心品质/无添加"——这些差异不是语言问题,而是深层文化价值观差异。
⭐⭐⭐☆☆
causalexperimentrecommendationmulti_agentdata_collectionpricing广告与投放客服与VOC推荐与搜索数据采集与治理MAS与智能体工程定价与利润风控与合规
16-智能体工程
传统 LLM Agent 在执行复杂任务时,把所有历史消息塞入 context window("full history" 模式),导致两个问题
⭐⭐☆☆☆
causalexperimentforecastingmulti_agentvisual_generation广告与投放供应链与补货推荐与搜索MAS与智能体工程风控与合规视觉内容生成
16-智能体工程
训练 LLM Agent 执行超长时域任务(50+ 步)面临两大瓶颈
⭐⭐⭐⭐☆
causalexperimentforecastingoptimizationmulti_agentdata_collectionpricing供应链与补货推荐与搜索数据采集与治理MAS与智能体工程定价与利润风控与合规
16-智能体工程
Google A2A 和 Anthropic MCP 这两大主流 Agent 通信协议存在共同缺陷:不暴露模型级属性。
⭐⭐☆☆☆
causalexperimentmulti_agentpricing客服与VOC数据采集与治理MAS与智能体工程定价与利润风控与合规
16-智能体工程
LMM-Searcher 解决长链多模态 Agent 的上下文爆炸问题:在 100 轮搜索会话中,若每张图片直接嵌入为 base64(约 1,000-3,000 tokens),50 张图片就会占用 50,000-150,000 tokens,远超实用预算。
⭐⭐☆☆☆
causalexperimentmulti_agentvisual_generation推荐与搜索MAS与智能体工程风控与合规视觉内容生成
16-智能体工程
The Orchestration of Multi-Agent Systems 把 LLM Agent 系统的演化分三阶段:单 Agent → 松耦合多 Agent → orchestrated 多 Agent。论文的核心贡献是把"orchestration"形式化为四层架构 + 两类协议
⭐⭐⭐⭐☆
experimentragmulti_agentvisual_generation广告与投放客服与VOC推荐与搜索知识图谱与RAG数据采集与治理MAS与智能体工程风控与合规视觉内容生成
16-智能体工程
MCPAgentBench (北京大学 + ZTE, 2026) 是首个专注于工具选择与执行效率的 MCP 评估基准。现有基准 (MCP-Universe, MCP-RADAR) 主要测正确性,忽略了一个关键问题:模型能完成任务,但效率极低 —— 该并行时串行、该串行时并行、传过多参数、反复试错。
⭐⭐⭐☆☆
causalexperimentoptimizationrecommendationmulti_agent客服与VOC推荐与搜索MAS与智能体工程风控与合规
16-智能体工程
间接 Prompt Injection(IPI) 的核心机制:攻击者无法直接访问 Agent 的系统提示,但可通过控制 Agent 抓取的外部内容(商品描述、用户评论、网页正文)向 Agent 上下文注入恶意指令,使 Agent 偏离原始任务目标执行攻击者意图。
⭐⭐☆☆☆
causalexperimentrecommendationmulti_agent客服与VOC推荐与搜索MAS与智能体工程风控与合规
16-智能体工程
Hermes 4 是 Nous Research 发布的开源权重混合推理模型家族,核心贡献是证明开源模型可以通过系统性后训练(pipeline)达到接近闭源前沿模型的 tool use 和推理能力。
⭐⭐⭐☆☆
experimentoptimizationmulti_agent客服与VOC推荐与搜索MAS与智能体工程风控与合规
16-智能体工程
随着 LLM agent 从单 agent 工具调用进化为协调团队(coordinated teams),RL 的优化对象不再是个体 action,而是编排轨迹(orchestration trace) —— 一个包含 spawn(生成)、delegate(委派)、communicate(通信)、aggregate(聚合)、stop(停止)决策的时序交互图。
⭐⭐⭐⭐⭐
causalexperimentoptimizationmulti_agent客服与VOC推荐与搜索数据采集与治理MAS与智能体工程风控与合规
16-智能体工程
最小权限原则在 Agent 中的实现:传统应用最小权限通过 OS/IAM 静态配置实现,但 LLM Agent 的工具调用集合在运行时动态变化,需要动态感知策略。Progent 用符号规则表示权限策略:`{tool: "purchase_order.create", constraints: {"amount": {"max": 1000}}}`,支持在任务执行中实时评估。
30-80 万元⭐⭐⭐☆☆
causalexperimentoptimizationmulti_agent广告与投放供应链与补货MAS与智能体工程风控与合规
16-智能体工程
AWS 2026 年的实证研究证明:通过领域特定 SFT,仅 350M 参数的小型语言模型 (SLM) 可以在 tool calling 任务上超越 175B+ 参数的 LLM。核心洞察是参数效率 > 参数规模——通用 LLM 的绝大多数参数被优化用于通用语言理解而非 tool manipulation,导致"参数稀释"。
⭐⭐☆☆☆
causalexperimentoptimizationmulti_agent供应链与补货客服与VOCMAS与智能体工程风控与合规
16-智能体工程
AdaptOrch 针对 LLM 能力收敛趋势(2026 年前沿模型 MMLU/HumanEval 差距 <5%)提出一个关键洞察:当个体模型能力趋同时,编排拓扑(拓扑选择) 的方差贡献远超 模型选择 的贡献,成为系统性能的主变量。
⭐⭐⭐⭐☆
causalexperimentforecastingrecommendationmulti_agent广告与投放客服与VOC推荐与搜索MAS与智能体工程风控与合规
16-智能体工程
LLM 工具调用存在系统性错位:模型既会过度调用(把可推理的问题交给工具),也会遗漏调用(低估工具对复杂查询的价值)。根本原因在于模型自感知与任务实际需求之间存在认知盲区——模型过度自信于自身知识覆盖,却对边界外的未知盲区无感知。
⭐⭐☆☆☆
causalexperimentforecastingoptimizationmulti_agentpricing客服与VOCMAS与智能体工程定价与利润风控与合规
16-智能体工程
Queen's University 2026 年的大规模实证研究揭示:97.1% 的 MCP tool 描述至少含有一个 smell,这些描述缺陷直接导致 FM 选错工具、传错参数或产生不必要的交互步骤。论文提出六维评分 rubric + 动态组件路由,在提升 agent 准确率 (+5.85pp) 的同时控制 token 开销 (+67.46% steps 的 trade-off)。
⭐⭐⭐☆☆
causalexperimentoptimizationrecommendationragmulti_agent供应链与补货客服与VOC推荐与搜索知识图谱与RAGMAS与智能体工程风控与合规
16-智能体工程
通用 VLM(如 GPT-4V、LLaVA 等)在电商场景表现欠佳,根本原因是三大领域偏差:同款多图(同一产品的主图/侧面图/背面图/细节图共享同一 listing,模型需跨图聚合)、属性中心化(电商问答 90% 是围绕结构化属性如"材质/尺寸/颜色",与图片描述类任务截然不同)、噪声图片(用户上传的低质量/遮挡/非标图占比极高)。
1.6 万元⭐⭐⭐☆☆
causalexperimentmulti_agentvisual_generation数据采集与治理MAS与智能体工程风控与合规视觉内容生成
17-价格优化
竞品价格监测不只是"看别人卖多少钱",而是建立价格-转化率的因果响应模型,在竞品降价时量化"不跟降会损失多少"和"跟降能获得多少",做出有数据支撑的响应决策。
5-60 万元⭐⭐☆☆☆
causalexperimentoptimizationpricing广告与投放定价与利润风控与合规
17-价格优化
上下文定价(Contextual Dynamic Pricing)将传统 MAB 定价问题扩展为依赖上下文的序贯决策。买家的潜在估值(valuation)被建模为
⭐⭐⭐☆☆
causalexperimentoptimizationknowledge_graphpricing知识图谱与RAG定价与利润风控与合规
18-物流履约
跨境母婴电商的物流追踪长期依赖纯文本状态更新("已揽收"、"在途中"、"清关中"),消费者对包裹实际位置和预期到达时间高度不确定,导致客服咨询量激增。AR Logistics Visualization 将三个技术栈融合
12.7 万⭐⭐⭐☆☆
causalexperimentforecastingfraud_detectionvisual_generation广告与投放供应链与补货客服与VOC风控与合规视觉内容生成
18-物流履约
跨境物流的核心是多式联运路径优化——海陆空铁四种运输方式在不同路段的成本/时效组合中找最优。最短路径 Dijkstra 扩展为多目标(成本、时效、碳排放)Pareto 最优路径。
30-50 万元⭐⭐☆☆☆
causalforecastingoptimizationfraud_detection供应链与补货风控与合规
18-物流履约
"Item Not Received"(INR)欺诈是跨境母婴电商最常见的纠纷类型,占纠纷总量约 35%
月均 -$3,200⭐⭐⭐☆☆
causalexperimentrecommendationknowledge_graphfraud_detection供应链与补货推荐与搜索知识图谱与RAG风控与合规
18-物流履约
预测退货概率 + 优化退货处理路径。退货概率用 XGBoost 建模(产品类别、价格、用户历史退货率、配送时长),退货处理用规则+成本优化——退货到 FBA vs 第三方仓 vs 弃置。
6-10 万元⭐⭐☆☆☆
causalforecastingoptimizationfraud_detectionpricing供应链与补货客服与VOC定价与利润风控与合规
19-风控反欺诈
检测广告点击中的无效流量(IVT)——Bot 点击、竞品恶意点击、重复点击。用时间序列异常 + 行为模式识别。
6-15 万元⭐⭐☆☆☆
causalexperimentoptimizationdata_collectionfraud_detection广告与投放客服与VOC数据采集与治理风控与合规
19-风控反欺诈
核心思想:在"产品 → 评论 → 评论者"三方动态异构图上检测刷评团伙群组。不看单条评论文本质量,而是看评论者之间的网络行为模式——真实用户构成稀疏随机网络,刷评团伙则共现密集、行为高度同步。
⭐⭐⭐☆☆
causalexperimentknowledge_graphfraud_detection客服与VOC知识图谱与RAG风控与合规
19-风控反欺诈
欺诈检测系统的核心上限由欺诈信号采集的覆盖度和质量决定。母婴电商面临的三类典型欺诈
48 万⭐⭐☆☆☆
experimentmulti_agentdata_collectionfraud_detection广告与投放客服与VOC数据采集与治理MAS与智能体工程风控与合规
19-风控反欺诈
核心思想:LLM 生成的虚假评论文本质量极高(语法流畅、情感真实),传统文本特征工程(词频/情感/长度)已失效。FraudSquad 转变思路——不只看"单条评论写得怎样",而是看"这个评论者在评论图中的行为模式是否异常"。
⭐⭐⭐☆☆
causalexperimentfraud_detection广告与投放客服与VOC推荐与搜索风控与合规
19-风控反欺诈
核心思想:三维欺诈信号融合检测账号欺诈——设备指纹相似度(识别同一设备多账号)+ 行为序列异常(购买/浏览模式偏差)+ 账号关联网络社区(图社区发现)。三维信号通过加权融合输出欺诈概率,任一维度异常均触发预警。
⭐⭐☆☆☆
experimentforecastingmulti_agentfraud_detection供应链与补货客服与VOCMAS与智能体工程风控与合规
19-风控反欺诈
GNN 图神经网络检测虚假评论——不是看单条评论文本,而是看评论者-产品-评分之间的关系图。虚假评论团通常呈现异常图模式:同批次账号、评分极端(1 或 5 星)、评论时间集中、文本相似度高。
5-15 万元⭐⭐⭐☆☆
causalknowledge_graphmulti_agentfraud_detection客服与VOC知识图谱与RAGMAS与智能体工程风控与合规
19-风控反欺诈
Isolation Forest + 动态阈值检测异常交易模式。特征:订单金额、支付方式、IP 国家 vs 收货国家、下单到支付间隔、同一 IP 下单频率、地址变更次数。
3-8 万元⭐⭐☆☆☆
experimentoptimizationfraud_detection广告与投放客服与VOC风控与合规
20-AI视频生成
在 TikTok 美国站推吸奶器,需要大量真人主播演示视频——但海外主播贵($200-500/条),中文主播语言不通,且更换主播需重新拍摄
50-100 万元⭐⭐⭐⭐☆
causalexperimentvisual_generation广告与投放风控与合规视觉内容生成
21-合规决策
核心思想:在决定进入新品类之前,用 NLP + 向量聚类对历史召回数据库(CPSC/RAPEX)做自动扫描,计算该品类的「召回风险密度」和「危害类型分布」,输出风险等级(低/中/高)+ 合规成本估算,作为 WF-D 选品扫描的进入前否决门。
⭐⭐☆☆☆
causalexperimentdata_collectionfraud_detection广告与投放数据采集与治理风控与合规
21-合规决策
核心思想:把 LLM 自动生成的合规风险控制从“生成后人工看一眼”升级为同步的加权评分系统。系统并行生成多个候选输出,对每个候选运行 PII、内容安全、schema、领域规则和证据引用检查,计算合规得分;一旦最佳候选超过阈值就提前返回,否则进入人工复核。
⭐⭐⭐☆☆
causalexperimentrecommendationmulti_agent广告与投放客服与VOC推荐与搜索MAS与智能体工程风控与合规
21-合规决策
核心思想:从 CPSC/NHTSA 非结构化消费者投诉文本出发,通过半参数主题模型(Hierarchical Dirichlet Process Pitman-Yor, HDPYP)自动提取缺陷主题,预测产品召回发生概率和召回组件类别。与传统 XGBoost/RF 相比,预测准确率提升约 14%(p<0.05),提前约 1 年预警召回事件。
⭐⭐☆☆☆
causalexperimentforecastingrecommendationmulti_agentdata_collectionfraud_detection供应链与补货客服与VOC推荐与搜索数据采集与治理MAS与智能体工程风控与合规
21-合规决策
核心思想:构建多辖区合规矩阵(产品类别 × 目标市场 × 监管要求),自动将产品映射到所有相关监管要求,输出国家专项合规清单。通过规则引擎实现合规优先级自动排序,解决多市场同步上架的合规复杂度问题。
⭐⭐☆☆☆
causalexperimentmulti_agent广告与投放数据采集与治理MAS与智能体工程风控与合规
21-合规决策
美国:CPSC 强制性标准(16 CFR)/ FDA 21 CFR / FCC
⭐⭐☆☆☆
experimentfraud_detection风控与合规
21-合规决策
将监管机构发布的非结构化更新,自动映射到受影响产品品类,并生成优先级告警,驱动合规行动。
⭐⭐☆☆☆
causalexperimentforecastingmulti_agentfraud_detection供应链与补货MAS与智能体工程风控与合规
21-合规决策
2023 年起德国《供应链尽职调查法》(LkSG)生效,要求年营业额 >4.5 亿欧元的企业对整条供应链的合规负责。母婴出海品牌虽暂无直接法律义务,但头部零售商(Walmart/Target/亚马逊)已要求供应商提供 ESG 合规证明
⭐⭐☆☆☆
experimentfraud_detection供应链与补货风控与合规
22-数据采集工程
论文:Tracing Roots [2604.10480] + DEBUGLM [2603.17884]
⭐⭐⭐☆☆
experimentrecommendationmulti_agentdata_collection推荐与搜索数据采集与治理MAS与智能体工程风控与合规
22-数据采集工程
供应商发来的报价单是 PDF,工厂产能表是 Excel 截图,海关 HS 编码文件是扫描件——这些"已有但不可用"的数据是母婴跨境电商最大的数据孤岛。传统 OCR(Tesseract)只能识别文字,无法理解表格结构、跨页截断、图文混排。
⭐⭐☆☆☆
causalexperimentforecastingoptimizationragdata_collectionpricingvisual_generation推荐与搜索知识图谱与RAG数据采集与治理定价与利润风控与合规视觉内容生成
22-数据采集工程
论文:JARVIS [2602.12941] + DS-DGA-GCN [2603.08332] + CAMERA [2605.20032]
⭐⭐⭐☆☆
experimentmulti_agentdata_collection客服与VOC数据采集与治理MAS与智能体工程风控与合规
22-数据采集工程
论文:SF-UBM [2604.14833] + MFG-RegretNet [2603.28329]
⭐⭐⭐⭐☆
causalexperimentrecommendationdata_collection广告与投放推荐与搜索数据采集与治理风控与合规
22-数据采集工程
论文:Sherpa.ai [2604.19219] + Cross-Domain SID [2606.01396]
⭐⭐⭐⭐☆
causalexperimentragknowledge_graphdata_collection广告与投放知识图谱与RAG数据采集与治理风控与合规
22-数据采集工程
论文:Contract2Plan [2601.06164] + ProUIE [2604.10633]
⭐⭐⭐☆☆
experimentoptimizationmulti_agentdata_collectionpricing数据采集与治理MAS与智能体工程定价与利润风控与合规