BaekRok/kb_stt_data
收藏Hugging Face2023-08-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/BaekRok/kb_stt_data
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频和对应的转录文本,分为训练集和测试集。训练集包含547198个样本,测试集包含7051个样本。数据集主要用于语音识别相关的研究和开发。
该数据集包含音频和对应的转录文本,分为训练集和测试集。训练集包含547198个样本,测试集包含7051个样本。数据集主要用于语音识别相关的研究和开发。
提供机构:
BaekRok
原始信息汇总
数据集概述
配置信息
- 默认配置 (
config_name: default)- 训练数据 (
split: train):data/train-* - 测试数据 (
split: test):data/test-*
- 训练数据 (
数据集特征
- 音频 (
name: audio): 数据类型为音频 - 转录文本 (
name: transcription): 数据类型为字符串
数据集统计
- 训练集 (
name: train)- 数据量: 547198个样本
- 存储大小: 32039652658.296字节
- 测试集 (
name: test)- 数据量: 7051个样本
- 存储大小: 476820708.01字节
数据集大小
- 下载大小: 36376973349字节
- 数据集总大小: 32516473366.306字节



