five

cairocode/MSP_IMPROV_ANNOTATED|情感分析数据集|图像识别数据集

收藏
hugging_face2024-06-03 更新2024-06-12 收录
情感分析
图像识别
下载链接:
https://hf-mirror.com/datasets/cairocode/MSP_IMPROV_ANNOTATED
下载链接
链接失效反馈
资源简介:
该数据集包含图像、标签、情感值、唤醒值及其归一化值。数据集分为训练集、验证集和测试集,分别包含5737、1010和1051个样本。总下载大小为737946528字节,数据集总大小为732784193.55字节。

该数据集包含图像、标签、情感值、唤醒值及其归一化值。数据集分为训练集、验证集和测试集,分别包含5737、1010和1051个样本。总下载大小为737946528字节,数据集总大小为732784193.55字节。
提供机构:
cairocode
原始信息汇总

数据集概述

数据集特征

  • image:图像数据,数据类型为图像。
  • label:标签,数据类型为整数(int64)。
  • valence:效价,数据类型为浮点数(float64)。
  • arousal:唤醒度,数据类型为浮点数(float64)。
  • arousal_norm:标准化唤醒度,数据类型为浮点数(float64)。
  • valence_norm:标准化效价,数据类型为浮点数(float64)。

数据集分割

  • 训练集(train):包含5737个样本,总大小为534920273.204字节。
  • 验证集(validation):包含1010个样本,总大小为94811771.15字节。
  • 测试集(test):包含1051个样本,总大小为103052149.196字节。

数据集大小

  • 下载大小:737946528字节。
  • 数据集总大小:732784193.55字节。

配置文件

  • 默认配置(default)
    • 训练集路径:data/train-*
    • 验证集路径:data/validation-*
    • 测试集路径:data/test-*
AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集 cairocode/MSP_IMPROV_ANNOTATED 的构建基于图像、标签及情绪相关属性的整合。数据集的构建者将图像与对应的标签、情感维度的量值(包括效价 valence 与唤醒度 arousal)相结合,形成了具有丰富情感信息的标注数据集。通过精心挑选并标注图像,构建了训练集、验证集与测试集,分别包含5737、1010和1051个样本,确保了模型的训练与评估质量。
特点
此数据集的特点在于其多维度的标注信息,不仅包含了图像的基本标签,还提供了图像的情感属性,如效价与唤醒度,并且对这两个情感维度进行了标准化处理。这种多维度的数据标注方式,为研究图像情感分析领域提供了宝贵的资源,有助于提升情感识别模型的准确性和泛化能力。
使用方法
使用该数据集时,用户可根据具体的任务需求选择合适的配置文件,数据集提供了默认配置,其中定义了训练集、验证集和测试集的路径。用户可以按照路径加载相应数据,进而进行模型训练、验证和测试。此外,数据集的下载大小和总大小已明确标出,便于用户预估存储需求并进行数据下载。
背景与挑战
背景概述
MSP-IMPROV-ANNOTATED数据集,诞生于音乐信息检索领域,由 cairocode 维护。该数据集的核心研究问题是音乐情感分析,旨在通过音频与图像的特征,对音乐的愉悦度和激活度进行量化。自创建以来,该数据集为音乐情感识别领域的研究提供了重要资源,推动了相关技术的发展与应用。
当前挑战
该数据集面临的挑战主要涉及两个方面:一是领域问题解决的挑战,即如何更精确地从音频与图像中提取特征,以准确判断音乐的情感状态;二是构建过程中的挑战,包括数据标注的主观性、数据多样性的保持以及大规模数据处理的效率问题。
常用场景
经典使用场景
在情感计算领域,cairocode/MSP_IMPROV_ANNOTATED数据集以其丰富的情感标签和图像内容,成为研究情感识别的重要资源。该数据集通过图像与对应的情感标签(包括效价和唤醒度),使得研究者能够深入探究图像情感表达的内在规律,从而为构建情感识别模型提供了基础。
实际应用
在实际应用中,该数据集可用于图像内容审核、个性化推荐系统以及智能交互设计等领域。它为机器学习模型提供了理解图像情感内容的能力,有助于提升用户体验,丰富人机交互的形式。
衍生相关工作
基于cairocode/MSP_IMPROV_ANNOTATED数据集,学术界已衍生出众多经典工作,包括情感识别算法的创新、跨模态情感分析模型的构建以及情感趋势预测等研究。这些工作不仅扩展了情感计算的研究范畴,也为相关技术的商业化应用奠定了坚实的理论基础。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

flames-and-smoke-datasets

该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。

github 收录

中国近海台风路径集合数据集(1945-2024)

1945-2024年度,中国近海台风路径数据集,包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。 数据源为获取温州台风网(http://www.wztf121.com/)的真实观测路径数据,经过处理整合后形成文件,如使用csv文件需使用文本编辑器打开浏览,否则会出现乱码,如要使用excel查看数据,请使用xlsx的格式。

国家海洋科学数据中心 收录

MeSH

MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。

www.nlm.nih.gov 收录

NIST Thermochemical Database

NIST Thermochemical Database(NIST热化学数据库)是一个包含大量热化学数据的数据集,涵盖了各种化学物质的热力学性质,如焓、熵、自由能等。该数据库由美国国家标准与技术研究院(NIST)维护,旨在为科学研究和工业应用提供准确的热化学数据。

webbook.nist.gov 收录