RAG-Enhanced Data Analysis(RAG 增强数据分析)
Skill-RAG-Enhanced-Data-Analysis · 09-DataAgent-LLM
causalexperimentforecastingragmulti_agentpricingvisual_generation供应链与补货推荐与搜索知识图谱与RAGMAS与智能体工程定价与利润视觉内容生成WF-A 智能补货WF-F 动态定价
收录于数据治理基础手册
年化 ROI减少重复分析 50%,节省分析人力
业务视角
适用角色数据分析师 / 运营负责人 · CEO · 供应链负责人
适用平台Amazon SP API · Shopify · TikTok Ads API · 多平台数据整合
什么情况下用数据需求太多,数据团队排期 2 周;非技术人员(采购/客服/运营)有数据问题但不会 SQL;重复报表占用大量时间
成功是什么样的业务方用自然语言自助查数据,常规报表自动化,数据驱动决策响应速度从「天」变「分钟」
业务痛点
1. 解决的问题
"为什么德国站吸奶器转化率下降"→ RAG 检索到上月分析"德国站转化率下降是因为欧元贬值导致价格上涨 8%"→本次发现同样模式→自动引用历史结论+实时数据验证
2. 核心算法逻辑
将 RAG 与数据分析 Agent 结合——数据分析问题检索相关知识库文档(历史分析报告、业务指标定义、分析方法模板),增强分析准确性和一致性。Query → Embedding → Retrieve relevant prior analyses → LLM generates analysis with context。
3. 业务应用场景
"为什么德国站吸奶器转化率下降"→ RAG 检索到上月分析"德国站转化率下降是因为欧元贬值导致价格上涨 8%"→本次发现同样模式→自动引用历史结论+实时数据验证。
年化:减少重复分析 50%,节省分析人力 10-20 万元。
4. 输入数据要求
请查看原始代码模板获取输入规格。
5. 输出结果
请查看原始代码模板获取输出规格。
6. 业务价值 / ROI
减少重复分析 50%,节省分析人力
7. 代码模板
代码块数量:1 · 路径:未检测到
import numpy as np
def rag_data_analysis(query: str, doc_embeddings: np.ndarray,
docs: list, query_emb: np.ndarray, top_k: int = 3):
scores = np.dot(doc_embeddings, query_emb)
top_idx = np.argsort(scores)[-top_k:][::-1]
return {'relevant_docs': [docs[i] for i in top_idx], 'scores': scores[top_idx].tolist()}
docs = ["德国站Q1转化率下降因欧元贬值", "美国站Prime Day转化率提升15%", "英国站受脱欧影响物流延迟"]
embs = np.random.randn(len(docs), 128); embs = embs / np.linalg.norm(embs, axis=1, keepdims=True)
q_emb = np.random.randn(128); q_emb = q_emb / np.linalg.norm(q_emb)
r = rag_data_analysis("德国转化率下降", embs, docs, q_emb)
print(f"Top doc: {r['relevant_docs'][0][:40]}...")
print("[✓] RAG Data Analysis 测试通过")
8. 论文来源
未自动抽取;请查看原始 Skill 卡片。