kamilakesbi/commonvoice_en_spd_train_small_test
收藏Hugging Face2024-03-26 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/kamilakesbi/commonvoice_en_spd_train_small_test
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频数据及其相关特征,如说话者和时间戳。数据集分为训练集、验证集和测试集,分别包含5、5和6个示例。音频的采样率为48000Hz。数据集的下载大小为15475220字节,总大小为19852260字节。
该数据集包含音频数据及其相关特征,如说话者和时间戳。数据集分为训练集、验证集和测试集,分别包含5、5和6个示例。音频的采样率为48000Hz。数据集的下载大小为15475220字节,总大小为19852260字节。
提供机构:
kamilakesbi
原始信息汇总
数据集概述
数据集特征
- audio: 采样率为48000的音频数据。
- speakers: 字符串序列,表示说话者信息。
- timestamps_start: 浮点数序列,表示音频开始的时间戳。
- timestamps_end: 浮点数序列,表示音频结束的时间戳。
数据集分割
- train: 包含5个样本,总大小为7029082.0字节。
- validation: 包含5个样本,总大小为6255312.0字节。
- test: 包含6个样本,总大小为6567866.0字节。
数据集大小
- 下载大小: 15475220字节。
- 数据集总大小: 19852260.0字节。
配置文件
- config_name: default
- data_files:
- train: 路径为
data/train-*。 - validation: 路径为
data/validation-*。 - test: 路径为
data/test-*。
- train: 路径为



