cairocode/MSPI_008|情感分析数据集|多模态数据数据集
收藏数据集概述
数据集特征
- image: 图像数据,数据类型为
image
。 - speaker: 说话者信息,数据类型为
string
。 - speakerID: 说话者ID,数据类型为
int64
。 - label: 标签,数据类型为
int64
。 - dataset: 数据集名称,数据类型为
string
。 - valence: 情感效价,数据类型为
float64
。 - arousal: 情感唤醒度,数据类型为
float64
。 - domination: 情感支配度,数据类型为
float64
。 - arousal_norm: 归一化后的情感唤醒度,数据类型为
float64
。 - valence_norm: 归一化后的情感效价,数据类型为
float64
。 - file_paths: 文件路径,数据类型为
string
。
数据集划分
- train: 训练集,包含2340个样本,大小为189294383.46336207字节。
- validation: 验证集,包含687个样本,大小为53285482.648731746字节。
- test: 测试集,包含572个样本,大小为55879477.02408564字节。
数据集大小
- 下载大小: 343068424字节。
- 数据集总大小: 298459343.13617945字节。
配置
- config_name: default
- data_files:
- train: 路径为
data/train-*
。 - validation: 路径为
data/validation-*
。 - test: 路径为
data/test-*
。
- train: 路径为
- data_files:

MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
HyperGlobal-450K - 全球最大规模高光谱图像数据集
HyperGlobal-450K数据集由武汉大学联合国内外多所知名高校及研究机构共同构建,是迄今为止全球规模最大的高光谱图像数据集。该数据集包含约45万张高光谱图像,规模等价于超过2000万张不重叠的三波段图像,远超现有的同类数据集。数据集涵盖了全球范围内的高光谱遥感图像,包括来自地球观测一号(EO-1)Hyperion和高分五号(GF-5B)两种传感器的图像,光谱范围从可见光到短波及中波红外,具有从紫外到长波红外的330个光谱波段,空间分辨率为30米。每幅图像经过精心处理,去除了无效波段和水汽吸收波段,保留了具有实际应用价值的光谱信息。HyperGlobal-450K数据集不仅支持高光谱图像的基础研究,还能够用于开发和测试各种高光谱图像处理方法,比如图像分类、目标检测、异常检测、变化检测、光谱解混、图像去噪和超分辨率等任务。
github 收录
VisDrone2019
VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。
github 收录
flames-and-smoke-datasets
该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。
github 收录