openslr/librispeech_asr|语音识别数据集|英语语音数据集
收藏数据集概述
基本信息
- 数据集名称: LibriSpeech
- 语言: 英语
- 许可证: CC BY 4.0
- 多语言性: 单语种
- 数据集大小: 100K<n<1M
- 源数据: 原始数据
- 任务类别: 自动语音识别, 音频分类
- 任务ID: 说话人识别
数据集配置
配置名称: clean
- 特征:
file
: 字符串audio
: 音频,采样率16000text
: 字符串speaker_id
: 整数chapter_id
: 整数id
: 字符串
- 分割:
train.100
: 28539个样本,6619683041字节train.360
: 104014个样本,23898214592字节validation
: 2703个样本,359572231字节test
: 2620个样本,367705423字节
- 下载大小: 30121377654字节
- 数据集大小: 31245175287字节
配置名称: other
- 特征:
file
: 字符串audio
: 音频,采样率16000text
: 字符串speaker_id
: 整数chapter_id
: 整数id
: 字符串
- 分割:
train.500
: 148688个样本,31810256902字节validation
: 2864个样本,337283304字节test
: 2939个样本,352396474字节
- 下载大小: 31236565377字节
- 数据集大小: 32499936680字节
配置名称: all
- 特征:
file
: 字符串audio
: 音频,采样率16000text
: 字符串speaker_id
: 整数chapter_id
: 整数id
: 字符串
- 分割:
train.clean.100
: 28539个样本,6627791685字节train.clean.360
: 104014个样本,23927767570字节train.other.500
: 148688个样本,31852502880字节validation.clean
: 2703个样本,359505691字节validation.other
: 2864个样本,337213112字节test.clean
: 2620个样本,368449831字节test.other
: 2939个样本,353231518字节
- 下载大小: 61357943031字节
- 数据集大小: 63826462287字节

Materials Project
材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)
OpenDataLab 收录
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录
OpenStreetMap (OSM)
OpenStreetMap (OSM) 是一个由志愿者创建和维护的全球性地图数据集。它包含了详细的地理信息,如道路、建筑物、水体、公园等。数据集以开放数据的形式提供,允许用户自由使用、修改和分享。
www.openstreetmap.org 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录