Aakali/commn-voice-11-translated
收藏Hugging Face2024-05-21 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Aakali/commn-voice-11-translated
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频和翻译句子两个特征。音频特征的采样率为48000赫兹,翻译句子为文本格式。数据集分为训练集和测试集,训练集包含6540个样本,测试集包含2894个样本。数据集的总大小约为284GB,下载大小约为259GB。数据文件按训练和测试分割存储在data/目录下。
该数据集包含音频和翻译句子两个特征。音频特征的采样率为48000赫兹,翻译句子为文本格式。数据集分为训练集和测试集,训练集包含6540个样本,测试集包含2894个样本。数据集的总大小约为284GB,下载大小约为259GB。数据文件按训练和测试分割存储在data/目录下。
提供机构:
Aakali
原始信息汇总
数据集概述
数据集特征
- audio:
- 数据类型: 音频
- 采样率: 48000 Hz
- sentence_translated:
- 数据类型: 字符串
数据集分割
- 训练集 (train):
- 示例数量: 6540
- 数据大小: 187205863.32 字节
- 测试集 (test):
- 示例数量: 2894
- 数据大小: 96824006.174 字节
数据集大小
- 下载大小: 259285456 字节
- 数据集总大小: 284029869.49399996 字节
数据文件配置
- 默认配置 (default):
- 训练集路径: data/train-*
- 测试集路径: data/test-*



