AravindVadlapudi02/UA_speech_mid|语音识别数据集|病理语音检测数据集
收藏数据集概述
数据集名称
UA_speech_mid
数据集特征
-
label:
- 数据类型: 类别标签
- 类别名称:
- 0: control
- 1: pathology
-
input_features:
- 数据类型: 序列,序列类型为float32
数据集划分
-
train:
- 示例数量: 789
- 数据大小: 757701948字节
-
test:
- 示例数量: 4832
- 数据大小: 4640324224字节
数据集大小
- 下载大小: 622894650字节
- 数据集总大小: 5398026172字节
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录
新型人类活动识别数据集
该数据集由都灵理工大学和马尔默大学合作创建,包含7类活动,利用60 GHz毫米波FMCW雷达在真实环境中收集。数据集旨在支持机器学习和深度学习模型在人类活动识别方面的研究,特别是对雷达特征图的时空结构进行保留的多维特征向量。数据集将公开,以推动FMCW雷达在智能环境监测中的应用研究。
arXiv 收录
Yahoo Finance
Dataset About finance related to stock market
kaggle 收录