rohitp1/SmallNoisyCommonSpeechEN
收藏Hugging Face2023-02-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/rohitp1/SmallNoisyCommonSpeechEN
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: audio
struct:
- name: array
sequence: float64
- name: path
dtype: 'null'
- name: sampling_rate
dtype: int64
- name: sentence
dtype: string
splits:
- name: train
num_bytes: 78272771286
num_examples: 100000
- name: val
num_bytes: 3796055210
num_examples: 5000
- name: test
num_bytes: 3840811928
num_examples: 5000
download_size: 7663445403
dataset_size: 85909638424
---
# Dataset Card for "SmallNoisyCommonSpeechEN"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征列表:
- 音频(audio):结构体类型,其子字段包括:
- 数组(array):float64 类型序列
- 路径(path):空(null)类型
- 采样率(sampling_rate):int64 类型
- 句子(sentence):字符串类型
数据集划分:
- 训练集(train):存储空间占用 78272771286 字节,样本数量 100000
- 验证集(val):存储空间占用 3796055210 字节,样本数量 5000
- 测试集(test):存储空间占用 3840811928 字节,样本数量 5000
下载大小:7663445403 字节
总数据集大小:85909638424 字节
# 数据集卡片:"SmallNoisyCommonSpeechEN"
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
rohitp1
原始信息汇总
数据集概述
数据集特征
- audio
- array: 数据类型为
float64的序列。 - path: 数据类型为
null。 - sampling_rate: 数据类型为
int64。
- array: 数据类型为
- sentence: 数据类型为
string。
数据集分割
- train
- 数据大小: 78272771286 字节
- 示例数量: 100000
- val
- 数据大小: 3796055210 字节
- 示例数量: 5000
- test
- 数据大小: 3840811928 字节
- 示例数量: 5000
数据集大小
- 下载大小: 7663445403 字节
- 数据集总大小: 85909638424 字节



