cairocode/MSPI_008|情感分析数据集|多模态数据数据集
收藏数据集概述
数据集特征
- image: 图像数据,数据类型为
image
。 - speaker: 说话者信息,数据类型为
string
。 - speakerID: 说话者ID,数据类型为
int64
。 - label: 标签,数据类型为
int64
。 - dataset: 数据集名称,数据类型为
string
。 - valence: 情感效价,数据类型为
float64
。 - arousal: 情感唤醒度,数据类型为
float64
。 - domination: 情感支配度,数据类型为
float64
。 - arousal_norm: 归一化后的情感唤醒度,数据类型为
float64
。 - valence_norm: 归一化后的情感效价,数据类型为
float64
。 - file_paths: 文件路径,数据类型为
string
。
数据集划分
- train: 训练集,包含2340个样本,大小为189294383.46336207字节。
- validation: 验证集,包含687个样本,大小为53285482.648731746字节。
- test: 测试集,包含572个样本,大小为55879477.02408564字节。
数据集大小
- 下载大小: 343068424字节。
- 数据集总大小: 298459343.13617945字节。
配置
- config_name: default
- data_files:
- train: 路径为
data/train-*
。 - validation: 路径为
data/validation-*
。 - test: 路径为
data/test-*
。
- train: 路径为
- data_files:

中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录
LEVIR-CD
LEVIR-CD 是一个新的大规模遥感建筑变化检测数据集。引入的数据集将成为评估变化检测 (CD) 算法的新基准,尤其是基于深度学习的算法。 LEVIR-CD 由 637 个非常高分辨率(VHR,0.5m/像素)Google Earth (GE) 图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时相图像具有显着的土地利用变化,尤其是建筑增长。 LEVIR-CD涵盖别墅住宅、高层公寓、小型车库和大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新建筑区域的变化)和建筑衰退。这些双时相图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。我们数据集中的每个样本都由一个注释器进行注释,然后由另一个注释器进行双重检查以产生高质量的注释。完整注释的 LEVIR-CD 总共包含 31,333 个单独的变更构建实例。
OpenDataLab 收录
AIS数据集
该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。
github 收录