aisha-org/augmention-common-voice-dataset

Name: aisha-org/augmention-common-voice-dataset
Creator: aisha-org
Published: 2024-07-11 07:44:33
License: 暂无描述

Hugging Face2024-07-11 更新2024-07-13 收录

下载链接：

https://hf-mirror.com/datasets/aisha-org/augmention-common-voice-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含音频数据和对应的文本转录，主要用于语音识别任务。数据集包含一个训练集，共有219,652个样本，总大小为4,764,830,563.764字节，下载大小为3,753,123,632字节。数据集的配置文件指定了训练集的数据文件路径。

This dataset contains audio data and corresponding text transcripts, primarily used for speech recognition tasks. The dataset includes a training set with 219,652 samples, totaling 4,764,830,563.764 bytes in size, and a download size of 3,753,123,632 bytes. The datasets configuration file specifies the path to the training sets data files.

提供机构：

aisha-org

原始信息汇总

数据集概述

许可证

MIT许可证

数据集信息

特征

音频
- 数据类型: 音频
转录文本
- 数据类型: 字符串

数据分割

训练集
- 样本数量: 219,652
- 数据大小: 4,764,830,563.764字节

数据集大小

下载大小: 3,753,123,632字节
总数据大小: 4,764,830,563.764字节

配置

默认配置
- 数据文件路径: data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集