five

JelleWo/vox_populi_en_VALTEST_pseudo_labelled

收藏
Hugging Face2024-04-04 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/JelleWo/vox_populi_en_VALTEST_pseudo_labelled
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多种语言的音频数据及其相关文本信息。数据集的特征包括音频ID、语言、音频、原始文本、标准化文本、性别、说话者ID、是否为黄金转录、口音以及Whisper转录等。数据集分为验证集和测试集,分别包含1753和1842个样本。数据集的总下载大小约为1.88GB,总数据集大小约为2.29GB。支持的语言包括英语、德语、法语、西班牙语、波兰语、意大利语、罗马尼亚语、匈牙利语、捷克语、荷兰语、芬兰语、克罗地亚语、斯洛伐克语、斯洛文尼亚语、爱沙尼亚语、立陶宛语以及带口音的英语。

该数据集包含多种语言的音频数据及其相关文本信息。数据集的特征包括音频ID、语言、音频、原始文本、标准化文本、性别、说话者ID、是否为黄金转录、口音以及Whisper转录等。数据集分为验证集和测试集,分别包含1753和1842个样本。数据集的总下载大小约为1.88GB,总数据集大小约为2.29GB。支持的语言包括英语、德语、法语、西班牙语、波兰语、意大利语、罗马尼亚语、匈牙利语、捷克语、荷兰语、芬兰语、克罗地亚语、斯洛伐克语、斯洛文尼亚语、爱沙尼亚语、立陶宛语以及带口音的英语。
提供机构:
JelleWo
原始信息汇总

数据集概述

数据集配置信息

  • 配置名称: en

数据集特征

  • audio_id: 数据类型为字符串。
  • language: 数据类型为分类标签,包含以下语言选项:
    • 0: en
    • 1: de
    • 2: fr
    • 3: es
    • 4: pl
    • 5: it
    • 6: ro
    • 7: hu
    • 8: cs
    • 9: nl
    • 10: fi
    • 11: hr
    • 12: sk
    • 13: sl
    • 14: et
    • 15: lt
    • 16: en_accented
  • audio: 数据类型为音频,采样率为16000 Hz。
  • raw_text: 数据类型为字符串。
  • normalized_text: 数据类型为字符串。
  • gender: 数据类型为字符串。
  • speaker_id: 数据类型为字符串。
  • is_gold_transcript: 数据类型为布尔值。
  • accent: 数据类型为字符串。
  • whisper_transcript: 数据类型为整数64位序列。

数据集分割

  • validation:
    • 字节数: 1149008063.766
    • 示例数: 1753
  • test:
    • 字节数: 1144657521.808
    • 示例数: 1842

数据集大小

  • 下载大小: 1878566845
  • 数据集大小: 2293665585.5740004

数据文件配置

  • 配置名称: en
  • 数据文件路径:
    • validation: en/validation-*
    • test: en/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作