zainulhakim/Stella20_Arabic_ASR
收藏Hugging Face2024-06-03 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/zainulhakim/Stella20_Arabic_ASR
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: audio
dtype:
audio:
sampling_rate: 16000
- name: text
dtype: string
splits:
- name: train20
num_bytes: 107975180.0
num_examples: 337
- name: train
num_bytes: 22748480.0
num_examples: 71
- name: validation
num_bytes: 4806017.0
num_examples: 15
- name: test
num_bytes: 5126418.0
num_examples: 16
download_size: 139710175
dataset_size: 140656095.0
configs:
- config_name: default
data_files:
- split: train20
path: data/train20-*
- split: train
path: data/train-*
- split: validation
path: data/validation-*
- split: test
path: data/test-*
---
数据集信息:
特征:
- 名称:audio(音频),数据类型为音频格式,采样率为16000赫兹
- 名称:text(文本),数据类型为字符串
数据划分:
- 划分名称:train20,占用字节数:107975180.0,样本数量:337
- 划分名称:train(训练集),占用字节数:22748480.0,样本数量:71
- 划分名称:validation(验证集),占用字节数:4806017.0,样本数量:15
- 划分名称:test(测试集),占用字节数:5126418.0,样本数量:16
下载总大小:139710175字节
数据集总大小:140656095.0字节
配置项:
- 配置名称:default(默认配置),数据文件映射:
- 划分:train20,文件路径:data/train20-*
- 划分:train,文件路径:data/train-*
- 划分:validation,文件路径:data/validation-*
- 划分:test,文件路径:data/test-*
提供机构:
zainulhakim
原始信息汇总
数据集概述
数据集特征
- audio:
- 数据类型: 音频
- 采样率: 16000 Hz
- text:
- 数据类型: 字符串
数据集分割
- train20:
- 示例数量: 337
- 数据大小: 107975180.0 字节
- train:
- 示例数量: 71
- 数据大小: 22748480.0 字节
- validation:
- 示例数量: 15
- 数据大小: 4806017.0 字节
- test:
- 示例数量: 16
- 数据大小: 5126418.0 字节
数据集大小
- 下载大小: 139710175 字节
- 数据集总大小: 140656095.0 字节
数据文件配置
- 默认配置:
- train20: 路径格式为
data/train20-* - train: 路径格式为
data/train-* - validation: 路径格式为
data/validation-* - test: 路径格式为
data/test-*
- train20: 路径格式为



