AravindVadlapudi02/UA_speech_mid|语音识别数据集|病理语音检测数据集

hugging_face2023-05-10 更新2024-03-04 收录

语音识别

病理语音检测

下载链接：

https://hf-mirror.com/datasets/AravindVadlapudi02/UA_speech_mid

下载链接

链接失效反馈

资源简介：

UA_speech_mid数据集包含语音数据，用于区分正常（control）和病理（pathology）语音。数据集特征包括label（分类标签，指示语音是否正常）和input_features（语音特征序列，数据类型为float32）。数据集分为训练集（789样本）和测试集（4832样本），总下载大小为622894650字节，总大小为5398026172字节。

提供机构：

AravindVadlapudi02

原始信息汇总

数据集概述

数据集名称

UA_speech_mid

数据集特征

label:
- 数据类型: 类别标签
- 类别名称:
  - 0: control
  - 1: pathology
input_features:
- 数据类型: 序列，序列类型为float32

数据集划分

train:
- 示例数量: 789
- 数据大小: 757701948字节
test:
- 示例数量: 4832
- 数据大小: 4640324224字节

数据集大小

下载大小: 622894650字节
数据集总大小: 5398026172字节

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库，由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音，录音在安静的室内环境中使用高保真麦克风进行，并下采样至16kHz。通过专业的语音标注和严格的质量检查，手动转录的准确率超过95%。该数据集免费供学术使用，旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

中国交通事故深度调查（CIDAS）数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息，以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例，单个案例信息包含人、车、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征，探索事故预防和损伤防护措施的关键数据源，为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性，12位男性)，以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情，歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常，强烈) 下产生的，另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位，48kHz .wav)，音频-视频 (720p H.264，AAC 48kHz，.mp4) 和仅视频 (无声音)。注意，Actor_18没有歌曲文件。

OpenDataLab 收录

新型人类活动识别数据集

该数据集由都灵理工大学和马尔默大学合作创建，包含7类活动，利用60 GHz毫米波FMCW雷达在真实环境中收集。数据集旨在支持机器学习和深度学习模型在人类活动识别方面的研究，特别是对雷达特征图的时空结构进行保留的多维特征向量。数据集将公开，以推动FMCW雷达在智能环境监测中的应用研究。

arXiv 收录

Yahoo Finance

Dataset About finance related to stock market

kaggle 收录