JelleWo/vox_populi_en_VALTEST_pseudo_labelled
收藏Hugging Face2024-04-04 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/JelleWo/vox_populi_en_VALTEST_pseudo_labelled
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多种语言的音频数据及其相关文本信息。数据集的特征包括音频ID、语言、音频、原始文本、标准化文本、性别、说话者ID、是否为黄金转录、口音以及Whisper转录等。数据集分为验证集和测试集,分别包含1753和1842个样本。数据集的总下载大小约为1.88GB,总数据集大小约为2.29GB。支持的语言包括英语、德语、法语、西班牙语、波兰语、意大利语、罗马尼亚语、匈牙利语、捷克语、荷兰语、芬兰语、克罗地亚语、斯洛伐克语、斯洛文尼亚语、爱沙尼亚语、立陶宛语以及带口音的英语。
该数据集包含多种语言的音频数据及其相关文本信息。数据集的特征包括音频ID、语言、音频、原始文本、标准化文本、性别、说话者ID、是否为黄金转录、口音以及Whisper转录等。数据集分为验证集和测试集,分别包含1753和1842个样本。数据集的总下载大小约为1.88GB,总数据集大小约为2.29GB。支持的语言包括英语、德语、法语、西班牙语、波兰语、意大利语、罗马尼亚语、匈牙利语、捷克语、荷兰语、芬兰语、克罗地亚语、斯洛伐克语、斯洛文尼亚语、爱沙尼亚语、立陶宛语以及带口音的英语。
提供机构:
JelleWo
原始信息汇总
数据集概述
数据集配置信息
- 配置名称: en
数据集特征
- audio_id: 数据类型为字符串。
- language: 数据类型为分类标签,包含以下语言选项:
- 0: en
- 1: de
- 2: fr
- 3: es
- 4: pl
- 5: it
- 6: ro
- 7: hu
- 8: cs
- 9: nl
- 10: fi
- 11: hr
- 12: sk
- 13: sl
- 14: et
- 15: lt
- 16: en_accented
- audio: 数据类型为音频,采样率为16000 Hz。
- raw_text: 数据类型为字符串。
- normalized_text: 数据类型为字符串。
- gender: 数据类型为字符串。
- speaker_id: 数据类型为字符串。
- is_gold_transcript: 数据类型为布尔值。
- accent: 数据类型为字符串。
- whisper_transcript: 数据类型为整数64位序列。
数据集分割
- validation:
- 字节数: 1149008063.766
- 示例数: 1753
- test:
- 字节数: 1144657521.808
- 示例数: 1842
数据集大小
- 下载大小: 1878566845
- 数据集大小: 2293665585.5740004
数据文件配置
- 配置名称: en
- 数据文件路径:
- validation: en/validation-*
- test: en/test-*



