sin2piusc/cv_gf_JP
收藏Hugging Face2024-04-24 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/sin2piusc/cv_gf_JP
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频和句子两个主要特征,音频采样率为16000Hz,句子为字符串类型。数据集分为训练集和测试集,训练集包含17308个样本,测试集包含1924个样本。数据集总下载大小为7310372816字节,总数据集大小为7463162494.007999字节。数据集配置为默认配置,数据文件路径分别对应训练集和测试集。数据集适用于自动语音识别任务,语言为日语,标签包括日语和处理过的数据,规模类别为1K<n<10K。
该数据集包含音频和句子两个主要特征,音频采样率为16000Hz,句子为字符串类型。数据集分为训练集和测试集,训练集包含17308个样本,测试集包含1924个样本。数据集总下载大小为7310372816字节,总数据集大小为7463162494.007999字节。数据集配置为默认配置,数据文件路径分别对应训练集和测试集。数据集适用于自动语音识别任务,语言为日语,标签包括日语和处理过的数据,规模类别为1K<n<10K。
提供机构:
sin2piusc
原始信息汇总
数据集概述
数据集特征
- audio:
- 数据类型: 音频
- 采样率: 16000 Hz
- sentence:
- 数据类型: 字符串
数据集分割
- 训练集:
- 样本数量: 17308
- 数据大小: 6706332150.844字节
- 测试集:
- 样本数量: 1924
- 数据大小: 756830343.164字节
数据集大小
- 下载大小: 7310372816字节
- 总数据集大小: 7463162494.007999字节
配置
- 默认配置:
- 训练数据路径: data/train-*
- 测试数据路径: data/test-*
许可
- 许可证: Apache-2.0
任务类别
- 自动语音识别
语言
- 日语
标签
- 日本语
- 已处理
大小类别
- 1K<n<10K



