EmoBench-M
收藏EmoBench-M 数据集概述
数据集简介
- 名称:EmoBench-M
- 目的:评估多模态大语言模型(MLLMs)在动态多模态环境中理解人类情感的能力
- 理论基础:基于心理学的情感智能(EI)理论
- 论文:EmoBench-M: Benchmarking Emotional Intelligence for Multimodal Large Language Models
数据集维度
- 基础情感识别(Foundational Emotion Recognition)
- 对话情感理解(Conversational Emotion Understanding)
- 社会复杂情感分析(Socially Complex Emotion Analysis)
数据集规模
- 覆盖13个多样化场景
- 包含超过5000个精心筛选的样本
任务类型
- 分类任务
- 生成任务
数据集结构
bash
EmoBench-M/
├── benchmark_json/ # 包含各数据集的元数据和标注JSON文件
│ ├── FGMSA_test_instruction.json
│ ├── MC-EIU-test_500.json
│ ├── MELD_test_instruction.json
│ ├── MOSEI_test_500.json
│ ├── MOSI_test_500.json
│ ├── MUSTARD_500.json
│ ├── RAVDSS_song_500.json
│ ├── RAVDSS_speech_500.json
│ ├── SIMS_test_500.json
│ ├── ch-simsv2s_test_500.json
│ ├── funny_test_instruction.json
│ ├── mer2023_test1_instruction.json
│ └── smile_test_data.json
└── dataset_500/ # 各数据集对应的视频文件
├── FGMSA_test_instruction/
├── MC-EIU-test_500/
├── MELD_test_instruction/
├── MOSEI_test_500/
├── MOSI_test_500/
├── MUSTARD_500/
├── RAVDSS_song_500/
├── RAVDSS_speech_500/
├── SIMS_test_500/
├── ch-simsv2s_test_500/
├── funny_test_instruction/
├── mer2023_test1_instruction/
└── smile_test_data/
评估任务
-
分类任务
- 命令:
python eval.py classification --json results.json --output classification.json - 适用数据集:除MC-EIU-test_500.json和smile_test_data.json外的所有数据集
- 命令:
-
联合情感+意图任务
- 命令:
python eval.py joint --json emotions.json --output joint.json - 适用数据集:MC-EIU-test_500.json
- 命令:
-
生成任务
- 命令:
python eval.py generation --json gen.json --output generation.json - 适用数据集:smile_test_data.json
- 命令:
数据获取
- 下载地址:Google Drive
引用格式
bibtex @article{hu2025emobench, title={EmoBench-M: Benchmarking Emotional Intelligence for Multimodal Large Language Models}, author={Hu, He and Zhou, Yucheng and You, Lianzhong and Xu, Hongbo and Wang, Qianning and Lian, Zheng and Yu, Fei Richard and Ma, Fei and Cui, Laizhong}, journal={arXiv preprint arXiv:2502.04424}, year={2025} }




