paper2skills Playbook

RAG-Enhanced Data Analysis(RAG 增强数据分析)

Skill-RAG-Enhanced-Data-Analysis · 09-DataAgent-LLM

causalexperimentforecastingragmulti_agentpricingvisual_generation供应链与补货推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润视觉内容生成WF-A 智能补货WF-F 动态定价
年化 ROI减少重复分析 50%,节省分析人力
业务视角
适用角色数据分析师 / 运营负责人 · CEO · 供应链负责人
适用平台Amazon SP API · Shopify · TikTok Ads API · 多平台数据整合
什么情况下用数据需求太多,数据团队排期 2 周;非技术人员(采购/客服/运营)有数据问题但不会 SQL;重复报表占用大量时间
成功是什么样的业务方用自然语言自助查数据,常规报表自动化,数据驱动决策响应速度从「天」变「分钟」
业务痛点
数据需求排期太长不会 SQL 只能等数据团队老板临时要数据没法马上出分析师时间都花在取数上

1. 解决的问题

"为什么德国站吸奶器转化率下降"→ RAG 检索到上月分析"德国站转化率下降是因为欧元贬值导致价格上涨 8%"→本次发现同样模式→自动引用历史结论+实时数据验证

2. 核心算法逻辑

将 RAG 与数据分析 Agent 结合——数据分析问题检索相关知识库文档(历史分析报告、业务指标定义、分析方法模板),增强分析准确性和一致性。Query → Embedding → Retrieve relevant prior analyses → LLM generates analysis with context。

3. 业务应用场景

"为什么德国站吸奶器转化率下降"→ RAG 检索到上月分析"德国站转化率下降是因为欧元贬值导致价格上涨 8%"→本次发现同样模式→自动引用历史结论+实时数据验证。

年化:减少重复分析 50%,节省分析人力 10-20 万元。

4. 输入数据要求

请查看原始代码模板获取输入规格。

5. 输出结果

请查看原始代码模板获取输出规格。

6. 业务价值 / ROI

减少重复分析 50%,节省分析人力

7. 代码模板

代码块数量:1 · 路径:未检测到

import numpy as np

def rag_data_analysis(query: str, doc_embeddings: np.ndarray, 
                       docs: list, query_emb: np.ndarray, top_k: int = 3):
    scores = np.dot(doc_embeddings, query_emb)
    top_idx = np.argsort(scores)[-top_k:][::-1]
    return {'relevant_docs': [docs[i] for i in top_idx], 'scores': scores[top_idx].tolist()}

docs = ["德国站Q1转化率下降因欧元贬值", "美国站Prime Day转化率提升15%", "英国站受脱欧影响物流延迟"]
embs = np.random.randn(len(docs), 128); embs = embs / np.linalg.norm(embs, axis=1, keepdims=True)
q_emb = np.random.randn(128); q_emb = q_emb / np.linalg.norm(q_emb)
r = rag_data_analysis("德国转化率下降", embs, docs, q_emb)
print(f"Top doc: {r['relevant_docs'][0][:40]}...")
print("[✓] RAG Data Analysis 测试通过")

8. 论文来源

未自动抽取;请查看原始 Skill 卡片。