rakshya34/filtered_voice_english_v1.21

Name: rakshya34/filtered_voice_english_v1.21
Creator: rakshya34
Published: 2024-05-27 06:08:37
License: 暂无描述

Hugging Face2024-05-27 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/rakshya34/filtered_voice_english_v1.21

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: path dtype: string - name: audio dtype: audio: sampling_rate: 48000 - name: transcription dtype: string - name: normalized_text dtype: string splits: - name: train num_bytes: 199387505.0 num_examples: 5000 download_size: 197308484 dataset_size: 199387505.0 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息：特征项： - 名称：path（路径），数据类型：字符串 - 名称：audio（音频），数据类型为音频格式，采样率为48000 - 名称：transcription（转录文本），数据类型：字符串 - 名称：normalized_text（归一化文本），数据类型：字符串数据集划分： - 名称：train（训练集），字节占用量：199387505.0，样本总数：5000 下载大小：197308484 数据集存储大小：199387505.0 配置项： - 配置名称：default（默认配置），对应数据文件： - 数据集划分：train（训练集），文件路径：data/train-*

提供机构：

rakshya34

原始信息汇总

数据集概述

数据集特征

path：文件路径，数据类型为字符串。
audio：音频数据，采样率为48000。
transcription：转录文本，数据类型为字符串。
normalized_text：规范化文本，数据类型为字符串。

数据集划分

train：训练集，包含5000个样本，总大小为199387505.0字节。

数据集大小

下载大小：197308484字节
数据集总大小：199387505.0字节

配置

default：默认配置，训练数据文件路径为data/train-*。

5,000+

优质数据集

54 个

任务类型

进入经典数据集