ameen2/KSANCC20240124
收藏Hugging Face2024-06-22 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ameen2/KSANCC20240124
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频文件及其对应的转录文本。数据集的特征包括批次(batch)、文件(file)、音频名称(audio_name)、音频(audio)和转录文本(transcript)。数据集只有一个训练集(train),包含200个样本,总大小为66,929,878字节。
This dataset contains audio files along with their corresponding transcriptions. The features of the dataset include batch, file, audio_name, audio, and transcript. The dataset has only one training set (train) with 200 samples and a total size of 66,929,878 bytes.
提供机构:
ameen2
原始信息汇总
数据集概述
数据集特征
- batch: 数据类型为字符串
- file: 数据类型为字符串
- audio_name: 数据类型为字符串
- audio: 数据类型为音频
- transcript: 数据类型为字符串
数据集分割
- train:
- 示例数量: 260
- 字节数: 63756257.0
数据集大小
- 下载大小: 63043970
- 数据集大小: 63756257.0
配置信息
- config_name: default
- data_files:
- split: train
- path: data/train-*
- split: train
- data_files:



