five

Voice of Customer (VoC): Consumer Complaints and Reviews, NLP Data

收藏
Snowflake2026-04-02 更新2026-04-03 收录
下载链接:
https://app.snowflake.com/marketplace/listing/GZTWZO5G5A
下载链接
链接失效反馈
官方服务:
资源简介:
WiserBrand provides a rich dataset of consumer complaints and reviews designed specifically for Data Science teams, NLP engineers, and Customer Experience (CX) platforms. This Voice of Customer (VoC) data captures the unfiltered reality of customer frustration, making it the perfect foundational dataset for analyzing **brand reputation data**, tracking **brand sentiment data**, and training Large Language Models (LLMs). Unlike standard rating datasets, this feed includes deep behavioral context, separating the core complaint text from the customer's explicitly stated wanted_solution and their review_recommendation. **This qualitative NLP dataset includes:** - **Verbatim Complaint Text:** Authentic, human-written descriptions of product failures, poor service, and operational bottlenecks (fully anonymized and PII-free). - **Intent & Resolution Data:** Specific fields capturing exactly what the consumer demands to resolve the issue, perfect for training intent-classification models. - **Brand & Industry Mapping:** Data is strictly mapped to company_name and category_name across multiple sectors (e.g., Airlines, E-commerce, Advertising). - **Rich Metadata:** Includes hashed user identifiers (HEM) for journey tracking, device types, precise timestamps, and geographic locations. **Use this unstructured text data to:** - **Fine-Tune LLMs & Chatbots:** Train AI models on authentic, emotion-heavy human language to improve automated customer support responses. - **Train Intent Classification Models:** Use the "wanted_solution" field to teach algorithms how to automatically categorize customer demands (e.g., Refund, Apology, Account Unlock). - **Extract Competitive Intelligence:** Read unfiltered reviews about your competitors to identify gaps in their product offerings or service quality. - **Monitor Brand Reputation:** Power topic-modeling engines with fresh, multi-industry complaint feeds to evaluate true brand sentiment.
提供机构:
Wiserbrand
创建时间:
2026-04-02
原始信息汇总

Voice of Customer (VoC): Consumer Complaints and Reviews, NLP Data

概述

WiserBrand 提供了一个专为数据科学团队、NLP 工程师和客户体验平台设计的消费者投诉与评论数据集。该数据集捕获了客户未经过滤的真实反馈,是分析品牌声誉、跟踪品牌情感以及训练大语言模型的理想基础数据集。与标准评分数据集不同,此数据集包含深层行为背景,将核心投诉文本与客户明确陈述的期望解决方案和评论推荐分开。

数据集内容

  • 原始投诉文本:关于产品故障、服务不佳和运营瓶颈的真实、人工撰写的描述(完全匿名且不含个人身份信息)。
  • 意图与解决数据:包含消费者为解决投诉所要求的具体措施,非常适合训练意图分类模型。
  • 品牌与行业映射:数据严格映射到跨多个行业(例如航空公司、电子商务、广告)的公司名称和类别名称。
  • 丰富的元数据:包括用于旅程跟踪的哈希用户标识符、设备类型、精确时间戳和地理位置。

主要用途

  • 微调大语言模型和聊天机器人:利用真实、充满情感的人类语言训练AI模型,以改进自动客户支持响应。
  • 训练意图分类模型:使用“期望解决方案”字段来教导算法如何自动分类客户需求(例如退款、道歉、账户解锁)。
  • 提取竞争情报:阅读关于竞争对手的未经过滤的评论,以识别其产品供应或服务质量方面的差距。
  • 监控品牌声誉:利用新鲜、多行业的投诉数据为话题建模引擎提供支持,以评估真实的品牌情感。

业务需求

  • 机器学习:为AI和数据科学团队提供高质量的原始文本数据,以训练和微调大语言模型。
  • 360度客户视图:提供对不满意客户旅程的全面了解,将整体品牌声誉数据与具体的、细粒度的用户反馈、推荐和跟踪哈希连接起来。
  • 情感分析:使营销和公关团队能够通过真实的消费者反馈评估品牌声誉。
  • 个性化客户体验:通过阅读客户的直接请求以及他们的位置和设备信息,支持团队可以了解真实的痛点。

数据字典

表名:CONSUMER_COMPLAINS_AND_REVIEWS

列名 数据类型 描述
COMPANY_NAME Varchar 公司名称
COMPLAINT_TITLE Varchar 投诉标题
COMPLAINT_TEXT Varchar 投诉文本
WANTED_SOLUTION Varchar 期望的解决方案
REVIEW_RECOMMENDATION Varchar 评论推荐
DEVICE_TYPE Varchar 设备类型
ACTIVATED_DATE Timestamp_NTZ 激活日期
COUNTRY Varchar 国家
STATE_PROVINCE Varchar 州/省
CITY_DISTRICT Varchar 城市/区
HEM Varchar 哈希用户标识符
REGISTER_DATE Timestamp_NTZ 注册日期
LAST_VISIT_DATE Timestamp_NTZ 最后访问日期
CATAGORY_NAME Varchar 类别名称

使用示例

提取原始投诉文本和客户期望的解决方案 此查询检索核心非结构化文本以及客户明确请求的解决方案。NLP工程师可以使用这些文本对来训练意图分类模型和自动支持路由算法。 sql SELECT COMPANY_NAME, COMPLAINT_TITLE, COMPLAINT_TEXT, WANTED_SOLUTION FROM PUBLIC.CONSUMER_COMPLAINS_AND_REVIEWS WHERE WANTED_SOLUTION IS NOT NULL LIMIT 5;

提供商信息

  • 提供商:Wiserbrand
  • 销售联系:data@wiserbrand.com
  • 支持联系:https://wiserbrand.com/contact-us/
  • 关于提供商:Wiserbrand是一家美国IT技术公司,拥有独家访问独特消费者数据的权限,例如客户支持电话的音频录音、消费者评论等。

数据集详情

  • 定价:免费试用
  • 试用:可用
  • 数据刷新:静态数据产品
  • 地理覆盖范围:全球(按州细分)
  • 云区域可用性:支持多个AWS区域(例如非洲开普敦、亚太雅加达、亚太孟买、亚太大阪等)
  • 法律条款:标准条款
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作