P paper2skillsPlaybook
AI 路线图 →

MOS Multi-Source Opinion Summary — LLM 多源评论整合摘要

Skill-MOS-Multi-Source-Opinion-Summary · 14-用户分析

causalexperimentoptimizationrecommendationdata_collection广告与投放客服与VOC推荐与搜索数据采集与治理WF-B 广告优化WF-C 客服分诊WF-D 选品扫描WF-E Review监控WF-J DTC 独立站增长WF-L 内容营销增长
实现难度⭐⭐☆☆☆
业务优先级⭐⭐⭐⭐⭐
业务视角
适用角色运营负责人 / 用户增长负责人 · CMO · 产品经理
适用平台Amazon 买家分层 · DTC 站 LTV 预测 · Klaviyo/Brevo 邮件分群
什么情况下用有大量老客户,但不知道谁是高价值客户、谁快要流失;新客获取成本越来越高,老客复购却上不去
成功是什么样的用户按 RFM/LTV 分层精准触达,高价值用户留存率提升,老客贡献收入占比从 30% 提升到 50%
业务痛点
老客复购率上不去不知道哪些用户要流失了所有用户用同一套活动买过一次就不见了

1. 解决的问题

跨平台 VOC 整合靠人工需 2-3 天,Amazon/TikTok/独立站关注点各异——M-OS 框架同时整合评论文本/产品规格/评分多源,30 分钟生成结构化摘要,月均节省 20-30 人时、关键信号漏报率降低 80%

2. 核心算法逻辑

核心思想:传统 VOC 分析只看 Amazon 评论,但消费者声音分散在 Amazon + TikTok 评论区 + 独立站 + 社交媒体,各平台用语风格不同,关注点也不同(Amazon 偏功能,TikTok 偏颜值体验,Reddit 偏长期使用)。MOS 框架用 LLM 同时整合评论文本、产品规格、评分数据等多源信息,构建结构化摘要,人类判断一致性 ρ=0.74,用户研究 87% 偏好 MOS 摘要。

3. 业务应用场景

- 业务问题:运营团队每月要整合 Amazon US(英文)、TikTok 评论(中英混合)、独立站反馈(中文)三个平台的用户声音,人工整理需要 2-3 天,且容易遗漏关键信号。 - 数据要求:各平台评论文本 + 产品规格 + 评分数据,支持中英双语混合输入。 - 预期产出: - 跨平台统一摘要(优点/缺点/使用场景/适合人群) - 各平台差异洞察("Amazon 用户关注噪音,TikTok 用户更在意外观设计") - 关键信号摘要(最高频提及的 Top-5 痛点 + Top-5 亮点) - 竞品对比摘要(如果提供竞品评论数据) - 业务价值:将跨平台 VOC 整合从 2-3 天压缩到 30

4. 输入数据要求

请查看原始代码模板获取输入规格。

5. 输出结果

请查看原始代码模板获取输出规格。

6. 业务价值 / ROI

  • ROI 预估:跨平台 VOC 整合从 2-3 天压缩到 30 分钟,月均节省 20-30 人时,关键信号漏报率降低 80%
  • 实施难度:⭐⭐☆☆☆(低,LLM API 调用 + 数据采集管道)
  • 优先级:⭐⭐⭐⭐⭐(多平台运营是母婴跨境标配,多源 VOC 整合是高频刚需)
  • 评估依据:IJCNLP 2025,人类判断一致性 ρ=0.74,用户研究 87% 偏好 M-OS 摘要

7. 代码模板

代码块数量:2 · 路径:未检测到

from dataclasses import dataclass, field
from typing import List, Dict
from collections import Counter

@dataclass
class PlatformReviews:
    platform: str
    reviews: List[str]
    avg_rating: float
    rating_dist: Dict[int, int] = field(default_factory=dict)

def extract_platform_signals(pr: PlatformReviews) -> Dict:
    all_text = ' '.join(pr.reviews).lower()
    pos_keywords = ['好用', 'love', 'great', 'quiet', '安静', '舒适', 'comfortable',
                    '方便', 'convenient', '效果好', 'effective', '推荐', 'recommend']
    neg_keywords = ['噪音', 'loud', 'noise', '漏奶', 'leak', '痛', 'painful',
                    '难清洗', 'hard to clean', '贵', 'expensive', '断货', '售后']
    pos_count = sum(all_text.count(k) for k in pos_keywords)
    neg_count = sum(all_text.count(k) for k in neg_keywords)
    pos_ratio = pos_count / (pos_count + neg_count + 1)
    top_pos = [k for k in pos_keywords if all_text.count(k) > 0][:3]
    top_neg = [k for k in neg_keywords if all_text.count(k) > 0][:3]
    return {'platform': pr.platform, 'avg_rating': pr.avg_rating,
            'pos_ratio': round(pos_ratio, 2), 'top_positive': top_pos,
            'top_negative': top_neg, 'review_count': len(pr.reviews)}

def multi_source_summary(platforms: List[PlatformReviews]) -> Dict:
    platform_signals = [extract_platform_signals(p) for p in platforms]
    all_pos = Counter()
    all_neg = Counter()
    for p in platforms:
        text = ' '.join(p.reviews).lower()
        for k in ['好用','安静','舒适','方便','效果好','推荐','love','great','quiet']:
            if text.count(k) > 0:
                all_pos[k] += text.count(k)
        for k in ['噪音','漏奶','痛','难清洗','贵','expensive','loud','painful']:
            if text.count(k) > 0:
                all_neg[k] += text.count(k)
    total_reviews = sum(len(p.reviews) for p in platforms)
    weighted_rating = sum(p.avg_rating * len(p.reviews) for p in platforms) / total_reviews
    platform_diff = []
    for sig in platform_signals:
        if sig['avg_rating'] > weighted_rating + 0.3:
            platform_diff.append(f"{sig['platform']} 评价明显更正面({sig['avg_rating']:.1f}星)")
        elif sig['avg_rating'] < weighted_rating - 0.3:
            platform_diff.append(f"{sig['platform']} 评价偏负面({sig['avg_rating']:.1f}星)")
    return {
        'total_reviews': total_reviews,
        'weighted_avg_rating': round(weighted_rating, 2),
        'top5_positives': [k for k, _ in all_pos.most_common(5)],
        'top5_negatives': [k for k, _ in all_neg.most_common(5)],
        'platform_differences': platform_diff,
        'platform_details': platform_signals,
    }

platforms = [
    PlatformReviews('Amazon US', [
        'Super quiet pump, love it! Easy to clean, my baby likes it.',
        'A bit expensive but worth it. Very comfortable, no pain at all.',
        'Loud noise at max level, otherwise great. Would recommend.',

8. 论文来源

  • 2507.04751