five

JovialValley/broadclass_totaldataset_4

收藏
hugging_face2022-12-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/JovialValley/broadclass_totaldataset_4
下载链接
链接失效反馈
资源简介:
--- dataset_info: features: - name: name dtype: string - name: audio dtype: audio: sampling_rate: 16000 - name: label dtype: string - name: emotion dtype: string - name: emotion_str dtype: string splits: - name: train num_bytes: 164137813.0 num_examples: 390 - name: test num_bytes: 41046167.0 num_examples: 97 download_size: 137497490 dataset_size: 205183980.0 --- # Dataset Card for "broadclass_totaldataset_4" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
JovialValley
原始信息汇总

数据集概述

数据集名称

  • 名称: broadclass_totaldataset_4

数据集特征

  • 特征列表:
    • name: 数据类型为字符串(string)
    • audio: 音频特征,采样率为16000
    • label: 数据类型为字符串(string)
    • emotion: 数据类型为字符串(string)
    • emotion_str: 数据类型为字符串(string)

数据集分割

  • 训练集:
    • 样本数量: 390
    • 数据大小: 164137813.0字节
  • 测试集:
    • 样本数量: 97
    • 数据大小: 41046167.0字节

数据集大小

  • 下载大小: 137497490字节
  • 总数据集大小: 205183980.0字节
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

OpenSonarDatasets

OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。

github 收录

FACED

FACED数据集是由清华大学脑与智能实验室和智能技术与系统国家重点实验室共同创建,包含从123名参与者收集的32通道EEG信号,用于情感计算研究。数据集通过记录参与者观看28个情感诱发视频片段时的EEG信号构建,旨在通过EEG信号分析情感状态。创建过程中,数据经过标准化和统一预处理,设计了四个EEG分类任务。该数据集主要应用于情感识别和脑机接口领域,旨在解决情感计算中的分类问题,提高情感识别的准确性和效率。

arXiv 收录

Employee Performance Dataset

该数据集包含新员工的实际表现数据,包括人口统计信息和测试分数。它作为高级线性代数在机器学习中的应用课程作业的基础资源,用于编写机器学习代码。

github 收录

THCHS-30

“THCHS30是由清华大学语音与语言技术中心(CSLT)发布的开放式汉语语音数据库。原始录音是2002年在清华大学国家重点实验室的朱晓燕教授的指导下,由王东完成的。清华大学计算机科学系智能与系统,原名“TCMSD”,意思是“清华连续普通话语音数据库”,时隔13年出版,由王东博士发起,并得到了教授的支持。朱小燕。我们希望为语音识别领域的新研究人员提供一个玩具数据库。因此,该数据库对学术用户完全免费。整个软件包包含建立中文语音识别所需的全套语音和语言资源系统。”

OpenDataLab 收录

MIDV-500

该数据集包含使用移动设备拍摄的不同文档图像,这些图像通常具有投影变形。数据集分为训练和测试两部分,其中训练部分包含30种文档类型,测试部分包含20种,在应用神经网络之前,所有图像都被缩放到统一的宽度,宽度为400像素。该数据集的任务是进行消失点检测。

arXiv 收录