ZeroWw/MEISD
收藏Hugging Face2024-05-28 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ZeroWw/MEISD
下载链接
链接失效反馈官方服务:
资源简介:
MEISD是一个多模态多标签的情感、强度和情感对话数据集,用于对话中的情感识别和情感分析。数据集包含电视剧名称、话语、对话ID、话语ID、季节、集数、开始时间、结束时间、情感、情绪、强度等多个字段。数据被分为训练集和测试集,分别包含14011和6006个例子。
MEISD是一个多模态多标签的情感、强度和情感对话数据集,用于对话中的情感识别和情感分析。数据集包含电视剧名称、话语、对话ID、话语ID、季节、集数、开始时间、结束时间、情感、情绪、强度等多个字段。数据被分为训练集和测试集,分别包含14011和6006个例子。
提供机构:
ZeroWw
原始信息汇总
数据集概述
数据集信息
- 名称: MEISD: A Multimodal Multi-Label Emotion, Intensity and Sentiment Dialogue Dataset for Emotion Recognition and Sentiment Analysis in Conversations
- 许可证: CC-BY-SA-4.0
数据集特征
- 数据类型:
- TV Series: string
- Utterances: string
- dialog_ids: int64
- uttr_ids: int64
- seasons: int64
- episodes: int64
- start_times: string
- end_times: string
- sentiment: string
- emotion: string
- intensity: string
- emotion2: string
- intensity2: string
- emotion3: string
- intensity3: float64
数据集分割
- 训练集:
- 示例数量: 14011
- 字节数: 2258603.7180396663
- 测试集:
- 示例数量: 6006
- 字节数: 968180.2819603337
数据集大小
- 下载大小: 1228924字节
- 数据集总大小: 3226784字节
任务类别
- 文本分类
- 文本生成
语言
- 英语
作者
- Firdaus, Mauajama
- Chauhan, Hardik
- Ekbal, Asif
- Bhattacharyya, Pushpak
搜集汇总
数据集介绍

构建方式
MEISD数据集的构建采用了一种综合性的方法,集成多种模态的信息,包括电视系列的对话文本、话音、季节和集数等元数据信息。该数据集以对话为基本单位,每条记录都包含有详细的情感标签,如情感类型、强度以及对应的情感维度,体现了构建者对情感识别与情绪分析的深刻理解。
特点
该数据集显著的特点在于其多模态、多标签的结构,涵盖了情感、情绪强度和情感极性等多个维度。数据集包含的对话片段源自电视系列,这使得其在情感表现上具有丰富的多样性和真实性。此外,数据集的规模适中,有利于模型训练与测试的平衡,确保了研究的有效性和可重复性。
使用方法
用户在使用MEISD数据集时,可以依据HuggingFace提供的 splits,分别获取训练集和测试集。数据集以JSON格式存储,便于处理和集成到不同的应用场景中。针对不同的任务,如文本分类和文本生成,用户可以根据数据集的配置文件选择相应的数据子集,进而开展情绪识别和情感分析的研究工作。
背景与挑战
背景概述
在情感识别与情感分析的研究领域,ZeroWw/MEISD数据集的构建标志着对会话情感理解的一次重要推进。该数据集由Firdaus, Mauajama与Chauhan, Hardik等研究人员共同开发,并于近年公布。其核心研究问题在于如何准确识别并分析对话中的情感、情绪强度及情感倾向。MEISD数据集的多模态、多标签特性使其在学术界产生了广泛影响,为相关领域的模型训练与算法研究提供了宝贵的资源。
当前挑战
尽管MEISD数据集为情感识别领域提供了丰富的标注数据,但其构建过程中亦面临诸多挑战。首先,对话情境的多样性使得情感标注具有主观性,不同标注者间的一致性成为一大难题。其次,多模态数据的同步与标注一致性在技术上也提出了较高要求。此外,如何在保证数据质量的同时处理大规模数据集,也是研究团队必须克服的挑战。在应用层面,如何提高模型的跨领域适应性,以及处理情感与情绪强度之间的相互影响,也是当前研究中的重要挑战。
常用场景
经典使用场景
在情感识别与情感分析研究领域,MEISD数据集以其丰富的多模态多标签特性,成为科研人员探究会话情感理解的重要资源。该数据集包含电视连续剧中的对白及其相关信息,如情感、情绪强度和 sentiment,为构建和评估情感识别模型提供了详实的文本和元数据。
实际应用
实际应用中,MEISD数据集为智能客服、语音助手和交互式媒体等提供了情感理解的基础数据支持。通过该数据集训练的模型能够更好地捕捉用户情绪,为提升用户体验和服务质量带来直接影响。
衍生相关工作
基于MEISD数据集的研究成果,学术界涌现出了一系列相关工作,包括情绪识别模型的构建、情感强度预测算法的开发以及多模态情感分析的研究。这些工作不仅丰富了情感计算的理论研究,也为相关技术的实际应用提供了方法学支持。
以上内容由遇见数据集搜集并总结生成



