lalok/firestation_gyeongsan_address_ko
收藏Hugging Face2024-07-05 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/lalok/firestation_gyeongsan_address_ko
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频文件及其对应的转录文本。音频文件的采样率为16000 Hz。数据集被分为训练集、测试集和验证集,分别包含221708、27714和27714个样本。数据集的总下载大小为35377418173字节,实际大小为38546060484.4字节。
This dataset contains audio files and their corresponding transcriptions. The audio files have a sampling rate of 16000 Hz. The dataset is divided into training, testing, and validation sets, with 221708, 27714, and 27714 examples respectively. The total download size of the dataset is 35377418173 bytes, and the actual size is 38546060484.4 bytes.
提供机构:
lalok
原始信息汇总
数据集概述
数据特征
- 音频
- 采样率: 16000
- 转录文本
- 数据类型: 字符串
数据集划分
- 训练集
- 字节数: 30808097617.871952
- 样本数: 221708
- 测试集
- 字节数: 3865989069.542026
- 样本数: 27714
- 验证集
- 字节数: 3871973796.9860253
- 样本数: 27714
数据集大小
- 下载大小: 35377418173 字节
- 总大小: 38546060484.4 字节
配置
- 默认配置
- 训练集路径: data/train-*
- 测试集路径: data/test-*
- 验证集路径: data/valid-*



