madhabpaul/assamese_speech_corpus
收藏Hugging Face2024-06-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/madhabpaul/assamese_speech_corpus
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- as
license: apache-2.0
task_categories:
- text-to-speech
- text-to-audio
- automatic-speech-recognition
pretty_name: assamese_speech_corpus
dataset_info:
- config_name: default
features:
- name: audio
dtype: audio
- name: text
dtype: string
- name: transcription
dtype: string
splits:
- name: train
num_bytes: 180656608.503
num_examples: 1877
download_size: 177978848
dataset_size: 180656608.503
- config_name: dual_1
features:
- name: audio
dtype: audio
- name: transcription
dtype: string
- name: gender
dtype: string
splits:
- name: train
num_bytes: 2499710442.564
num_examples: 2812
download_size: 2457362015
dataset_size: 2499710442.564
- config_name: female_1
features:
- name: audio
dtype: audio
- name: transcription
dtype: string
splits:
- name: train
num_bytes: 4491574233.545
num_examples: 8705
download_size: 4727313788
dataset_size: 4491574233.545
- config_name: male_1
features:
- name: audio
dtype: audio
- name: transcription
dtype: string
splits:
- name: train
num_bytes: 3900445815.842
num_examples: 8941
download_size: 4254963326
dataset_size: 3900445815.842
- config_name: male_2
features:
- name: audio
dtype: audio
- name: transcription
dtype: string
splits:
- name: train
num_bytes: 180562898.503
num_examples: 1877
download_size: 177913526
dataset_size: 180562898.503
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- config_name: dual_1
data_files:
- split: train
path: dual_1/train-*
- config_name: female_1
data_files:
- split: train
path: female_1/train-*
- config_name: male_1
data_files:
- split: train
path: male_1/train-*
- config_name: male_2
data_files:
- split: train
path: male_2/train-*
---
提供机构:
madhabpaul
原始信息汇总
数据集概述
基本信息
- 语言: 阿萨姆语 (as)
- 许可证: Apache 2.0
- 任务类别:
- 文本到语音
- 文本到音频
- 自动语音识别
- 数据集名称: assamese_speech_corpus
配置信息
默认配置 (default)
- 特征:
- 音频 (audio)
- 文本 (text)
- 转录文本 (transcription)
- 分割:
- 训练集 (train)
- 字节数: 180656608.503
- 样本数: 1877
- 训练集 (train)
- 下载大小: 177978848
- 数据集大小: 180656608.503
双语配置 (dual_1)
- 特征:
- 音频 (audio)
- 转录文本 (transcription)
- 性别 (gender)
- 分割:
- 训练集 (train)
- 字节数: 2499710442.564
- 样本数: 2812
- 训练集 (train)
- 下载大小: 2457362015
- 数据集大小: 2499710442.564
女性配置 (female_1)
- 特征:
- 音频 (audio)
- 转录文本 (transcription)
- 分割:
- 训练集 (train)
- 字节数: 4491574233.545
- 样本数: 8705
- 训练集 (train)
- 下载大小: 4727313788
- 数据集大小: 4491574233.545
男性配置 (male_1)
- 特征:
- 音频 (audio)
- 转录文本 (transcription)
- 分割:
- 训练集 (train)
- 字节数: 3900445815.842
- 样本数: 8941
- 训练集 (train)
- 下载大小: 4254963326
- 数据集大小: 3900445815.842
男性配置 (male_2)
- 特征:
- 音频 (audio)
- 转录文本 (transcription)
- 分割:
- 训练集 (train)
- 字节数: 180562898.503
- 样本数: 1877
- 训练集 (train)
- 下载大小: 177913526
- 数据集大小: 180562898.503
数据文件路径
- 默认配置 (default):
- 训练集: data/train-*
- 双语配置 (dual_1):
- 训练集: dual_1/train-*
- 女性配置 (female_1):
- 训练集: female_1/train-*
- 男性配置 (male_1):
- 训练集: male_1/train-*
- 男性配置 (male_2):
- 训练集: male_2/train-*



