MC-EIU
收藏MC-EIU 数据集概述
简介
MC-EIU 数据集是用于多模态对话中情感和意图联合理解的基准数据集。详细信息可参见论文:Emotion and Intent Joint Understanding in Multimodal Conversation: A Benchmarking Dataset。
数据集概览
数据集统计信息如下:
| 统计项 | 英语 | 普通话 | ||||
|---|---|---|---|---|---|---|
| 训练集 | 验证集 | 测试集 | 训练集 | 验证集 | 测试集 | |
| # 对话数 | 2,807 | 400 | 806 | 667 | 95 | 195 |
| # 话语数 | 31,451 | 4,509 | 9,049 | 7,643 | 1,148 | 2,212 |
| # 时长 (小时) | 28.51 | 4.02 | 8.22 | 8.51 | 1.36 | 2.42 |
| 平均话语长度 (UL) | 12.68 | 12.49 | 12.76 | 19.11 | 19.91 | 18.14 |
| 平均话语时长 (DU, 秒) | 3.26 | 3.21 | 3.27 | 4.01 | 4.26 | 3.94 |
| 平均每对话话语数 (UC) | 11.20 | 11.27 | 11.23 | 11.46 | 12.08 | 11.34 |
| 平均每对话情感数 (EC) | 2.58 | 2.57 | 2.60 | 2.41 | 2.54 | 2.42 |
| 平均每对话意图数 (IC) | 3.29 | 3.86 | 3.87 | 3.18 | 3.24 | 3.10 |
下载
MC-EIU 数据集的 Hugging Face 链接为:https://huggingface.co/datasets/YulangZhuo/MC-EIU/tree/main。
引用
如需引用该数据集,请使用以下格式:
@article{liu2024emotion, title={Emotion and Intent Joint Understanding in Multimodal Conversation: A Benchmarking Dataset}, author={Liu, Rui and Zuo, Haolin and Lian, Zheng and Xing, Xiaofen and Schuller, Bj{"o}rn W and Li, Haizhou}, journal={arXiv preprint arXiv:2407.02751}, year={2024} }
使用
训练 MC-EIU
-
首先使用所有声学、视觉和文本模态预训练编码器。以普通话数据集为例: bash bash scripts/our/pretrain_Mandarin.sh AVL [num_of_expr] [GPU_index]
-
然后训练 MC-EIU 模型: bash bash scripts/our/our_Mandarin.sh [num_of_expr] [GPU_index]
其中
[num_of_expr]表示自定义的训练次数,[GPU_index]表示要使用的 GPU 索引。
许可证
该数据集采用 CC BY-NC 4.0 许可证。
版权所有 (c) 2024 S2Lab, 内蒙古大学,呼和浩特,中国。




