five

Comp4.0

收藏
Hugging Face2025-07-23 更新2025-07-24 收录
下载链接:
https://huggingface.co/datasets/NShreya/Comp4.0
下载链接
链接失效反馈
官方服务:
资源简介:
CompSense4.0是一个iPhone客户投诉数据集,集成了视觉上下文,通过图像-文本匹配提供更加丰富的信息。该数据集包含了投诉文本和相应的图像,图像作为视觉上下文,帮助理解投诉内容。
创建时间:
2025-07-20
原始信息汇总

CompSense4.0: iPhone客户投诉数据集(带视觉上下文)

数据集概述

CompSense4.0是一个集成了视觉上下文的iPhone客户投诉数据集,通过图像-文本匹配技术增强数据语义关联。本版本采用基于CLIP模型的多维度相似度评估方法,确保图像与投诉文本、方面类别和严重程度的高度相关性。

核心数据

  • 总对话数: 915
  • 带图像对话数: 914(99.9%分配率)
  • 唯一图像数: 4478(其中4431张从未被分配)

数据结构

字段 类型 描述
thread_id int32 对话唯一标识符
text string 客户投诉文本
image_path image 关联图像路径(未匹配则为None
aspect string 投诉方面类别
severity string 投诉严重程度等级

分类体系

方面类别

  • 主要类别:软件(672例)、硬件(83例)、质量(46例)、服务(48例)、价格(4例)、包装(8例)
  • 具体问题
    • 软件:应用故障、系统错误、存储问题
    • 硬件:电池、屏幕损坏、进水问题
    • 服务:售后支持、维修体验

严重程度

  • Blame(271例):直接指责公司
  • Disapproval(268例):表达不满
  • Accusation(156例):指控性语言
  • No Explicit Reproach(211例):中性投诉

图像类型

包含15类Reddit来源图像,涵盖:

  • 键盘输入问题(type1)
  • 系统更新故障(type2)
  • 电池续航(type3)
  • 屏幕损坏(type5)
  • 摄像头问题(type7)
  • 配件问题(type14)等

技术方法

图像匹配流程

  1. CLIP嵌入:文本(含方面/严重程度)和图像分别嵌入
  2. 三维相似度计算
    • 文本-图像相似度(阈值0.28)
    • 方面-图像相似度(阈值0.2)
    • 严重程度-图像相似度(阈值0.18)
  3. 加权综合评分:文本权重0.5,方面0.3,严重程度0.2
  4. 最终阈值:综合评分需超过0.25

文件结构

  • train/:主数据集
  • images/:关联图像
  • thread_image_mapping.csv:完整相似度评分
  • 3个JSON文件:未分配图像、高分未分配图像注释、已分配图像评分

使用许可

MIT License(需注意图像来源的单独授权要求)

引用格式

bibtex @dataset{compsense4_2025, title={CompSense4.0: Complaint Dataset with Visual Context (Annotation-Aware Matching)}, author={NShreya}, year={2025}, url={https://huggingface.co/datasets/NShreya/Comp4.0} }

搜集汇总
数据集介绍
main_image_url
构建方式
CompSense4.0数据集通过创新的多模态匹配方法构建,专注于iPhone用户投诉的视觉上下文分析。研究团队采用CLIP模型对投诉文本和图像进行嵌入,通过计算文本-图像、属性-图像和严重程度-图像三个维度的余弦相似度,设定严格的阈值筛选标准。只有当图像在所有三个维度均超过预设阈值,并通过加权综合评分后,才会被分配到对应投诉中。该方法确保了视觉内容与投诉语义的高度相关性,同时允许优质图像跨多轮投诉复用。
使用方法
使用者可通过HuggingFace数据集库直接加载该资源,主要数据存储在train分割中,包含文本、图像路径及标注信息。配套提供的assigned_image_scores.json文件详细记录了每张分配图像的CLIP评分细节,便于分析匹配质量。对于研究视觉上下文在投诉理解中的作用,建议结合图像分类器与文本分析模型,利用属性标签构建多任务学习框架。数据集额外包含高分未分配图像的自动标注结果,为负样本分析提供了宝贵资源。
背景与挑战
背景概述
CompSense4.0数据集是iPhone客户投诉数据集的进阶版本,由NShreya团队于2025年发布,旨在通过整合视觉上下文提升客户投诉分析的深度与广度。该数据集创新性地引入了基于CLIP模型的多维度图像-文本匹配机制,将客户投诉文本与其对应的视觉内容、投诉类别及严重程度进行语义对齐,为多模态情感分析与产品缺陷研究提供了宝贵资源。其核心价值在于通过严格的相似度阈值控制,确保图像与文本在语义、属性和情感层面的高度一致性,推动了客户体验管理与产品质量评估领域的范式转变。
当前挑战
构建CompSense4.0数据集面临双重挑战:在领域问题层面,需解决多模态投诉数据中视觉与文本语义鸿沟的难题,特别是图像需同时满足与投诉内容、技术属性(硬件/软件)和情感强度(指责程度)的三重匹配;在构建技术层面,CLIP模型跨模态嵌入的精度不足导致大量图像无法通过严格阈值(4431张未匹配图像),而动态权重分配(文本0.5/属性0.3/情感0.2)与复合评分机制的设计需要平衡语义相关性与标注特异性。此外,Reddit社区图像的异构性(15类技术问题)与投诉文本的隐含情感表达,进一步增加了跨模态对齐的复杂度。
常用场景
经典使用场景
在消费者行为分析与多模态机器学习领域,CompSense4.0数据集通过融合视觉语境与文本投诉数据,为研究者提供了探索用户反馈表达方式的理想实验平台。其严格的多维度图像匹配机制,使得该数据集特别适用于训练跨模态表征模型,例如验证CLIP等预训练模型在细粒度语义对齐任务中的性能表现。
解决学术问题
该数据集有效解决了多模态情感分析中的关键挑战——如何建立文本投诉与视觉证据之间的语义关联。通过引入基于aspect和severity的三重相似度阈值,为学术社区提供了研究标注感知跨模态匹配的基准数据,显著推进了消费电子领域细粒度意见挖掘的精度边界。
实际应用
在商业智能系统中,该数据集可优化客户服务自动化流程。企业能够基于视觉化投诉模式识别高频硬件缺陷(如屏幕损坏)或软件问题(如系统崩溃),进而指导产品质量改进。电商平台亦可利用其多模态特性构建智能客服系统,实现投诉内容的自动分类与优先级排序。
数据集最近研究
最新研究方向
在消费者行为分析与多模态机器学习领域,CompSense4.0数据集通过融合视觉语境与文本投诉数据,为情感计算与产品缺陷分析提供了新的研究范式。当前研究聚焦于CLIP模型驱动的跨模态对齐技术,探索语义层面对投诉文本、产品类别与情绪强度的三重匹配机制。该数据集正被应用于智能客服系统的视觉辅助决策研究,通过分析硬件缺陷的典型图像特征与文本描述的关联性,提升自动化问题分类的准确率。近期相关研究还涉及基于多维度相似性阈值的动态权重优化,以解决跨模态数据稀疏场景下的特征表示难题。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作