Porameht/processed-cv-17-th-130k
收藏Hugging Face2024-05-24 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Porameht/processed-cv-17-th-130k
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- th
size_categories:
- 100K<n<1M
task_categories:
- automatic-speech-recognition
- audio-to-audio
- audio-classification
dataset_info:
features:
- name: sentence
dtype: string
- name: audio
dtype: audio
splits:
- name: train
num_bytes: 3119446215.24
num_examples: 117536
- name: dev
num_bytes: 106464025.6
num_examples: 3950
- name: test
num_bytes: 247695261.785
num_examples: 9065
download_size: 3397725524
dataset_size: 3473605502.6249995
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: dev
path: data/dev-*
- split: test
path: data/test-*
---
提供机构:
Porameht
原始信息汇总
数据集概述
基本信息
- 语言: 泰语 (th)
- 大小类别: 100K<n<1M
- 任务类别:
- 自动语音识别
- 音频到音频转换
- 音频分类
数据集特征
- 特征名称: sentence
- 数据类型: 字符串
- 特征名称: audio
- 数据类型: 音频
数据分割
- 训练集:
- 数据量 (字节): 3119446215.24
- 样本数量: 117536
- 开发集:
- 数据量 (字节): 106464025.6
- 样本数量: 3950
- 测试集:
- 数据量 (字节): 247695261.785
- 样本数量: 9065
数据集大小
- 下载大小: 3397725524 字节
- 数据集总大小: 3473605502.6249995 字节
配置信息
- 配置名称: default
- 数据文件路径:
- 训练集: data/train-*
- 开发集: data/dev-*
- 测试集: data/test-*



