CH-SIMSandCMU-MOSI dataset
收藏DataCite Commons2025-04-27 更新2025-04-16 收录
下载链接:
https://www.scidb.cn/detail?dataSetId=c690d579341445a8adf8e1755e70b20e
下载链接
链接失效反馈官方服务:
资源简介:
CH-SIMS Dataset: This dataset consists of 2,281 video clips from different data sources, with a total of 474 speakers. The modal categories include three modalities: vision, speech, and text. The SIMS dataset is a unique Chinese multi-modal sentiment classification dataset with fine-grained annotations. The videos contain spontaneous expressions, various head postures, and video occlusions. Annotators assign an emotion score to each labeled sample ranging from -1 (strongly negative) to 1 (strongly positive).CMU-MOSI Dataset: This dataset is constructed based on YouTube videos. Annotators label the emotion of each sample with a score ranging from -3 (strongly negative) to 3 (strongly positive).分享这两个数据集的具体应用场景有哪些?这两个数据集的优缺点分别是什么?多模态情感分类数据集的发展趋势是怎样的?
CH-SIMS 数据集:该数据集包含来自不同数据源的2281个视频片段,总计涉及474名说话者。其模态类别涵盖视觉(vision)、语音(speech)、文本(text)三种模态。CH-SIMS 数据集是一款独特的中文多模态情感分类(multi-modal sentiment classification)数据集,带有细粒度标注(fine-grained annotations)。视频内容包含自然流露的表情、多样的头部姿态以及视频遮挡(video occlusions)情况。标注人员为每个标注样本赋予情感分数(emotion score),分数范围为-1(极强负面)至1(极强正面)。CMU-MOSI 数据集:该数据集基于YouTube视频构建。标注人员为每个样本标注情感分数(emotion score),分数范围为-3(极强负面)至3(极强正面)。
提供机构:
Science Data Bank
创建时间:
2025-02-05
搜集汇总
数据集介绍

背景与挑战
背景概述
CH-SIMS是一个包含2,281个视频片段的中文多模态情感分类数据集,涵盖视觉、语音和文本三种模态,情感标注范围为-1到1。CMU-MOSI是基于YouTube视频构建的多模态情感分类数据集,情感标注范围为-3到3。两个数据集均适用于多模态情感分析研究。
以上内容由遇见数据集搜集并总结生成



