有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
数据集名称: SpeechCommands
语言: 英语 (BCP-47 en
)
多语言性: 单语
许可证: CC-BY-4.0
任务类别: 音频分类
任务ID: keyword-spotting
数据集大小:
v0.01
: 10K<n<100Kv0.02
: 100K<n<1M数据集来源: 原始数据
数据集配置:
v0.01
: 包含64,727个音频文件,发布于2017年8月3日。v0.02
: 包含105,829个音频文件,发布于2018年4月11日。数据集特征:
file
: 字符串类型,音频文件名。audio
: 音频类型,采样率为16000。label
: 类别标签类型,包含多个预定义的单词标签。is_unknown
: 布尔类型,指示单词是否为辅助词。speaker_id
: 字符串类型,说话者唯一ID。utterance_id
: 整数类型,同一说话者内单词发音的增量ID。数据集分割:
v0.01
:
v0.02
:
下载大小与数据集大小:
v0.01
: 下载大小1,454,702,755字节,数据集大小1,942,468,128字节。v0.02
: 下载大小2,285,975,869字节,数据集大小3,157,912,956字节。数据实例:
label
为单词,is_unknown
为 False
。label
为单词,is_unknown
为 True
。label
为 _silence_
。数据字段:
file
: 音频文件的相对路径。audio
: 包含音频文件路径、解码音频数组和采样率。label
: 音频样本中的单词或背景噪声类别。is_unknown
: 指示单词是否为辅助词。speaker_id
: 说话者的唯一ID。utterance_id
: 单词发音的增量ID。数据分割:
v0.01
和 v0.02
,后者包含更多单词。来源数据:
v0.01
包含30个不同的单词。v0.02
新增了5个单词。注释过程:
个人和敏感信息:
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
人民日报语料库 (1998.1)
本库主要提供用于NER任务的处理好的语料,包括基于词级和字级任务的NER数据。数据集包含19484个以行为粒度切分的句子,句子长度最大为659,平均长度为57.55666187641141。实体标注采用BIO格式,区分人名、地名和机构团体。
github 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
糖尿病预测数据集
糖尿病相关的医学研究或者健康数据
AI_Studio 收录