five

Cnam-LMSSC/vibravox_enhanced_by_EBEN_tmp

收藏
Hugging Face2024-05-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Cnam-LMSSC/vibravox_enhanced_by_EBEN_tmp
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个用于内部测试的临时数据集,包含两个配置:speech_clean和speech_noisy。每个配置都包含来自不同音频来源的数据(如口部佩戴的参考麦克风、额头上的微型加速度计等),以及相关的元数据(如性别、说话者ID、句子ID、持续时间、原始文本、标准化文本和音素化文本)。speech_clean配置的测试集包含1979个样本,speech_noisy配置的测试集包含69个样本。

该数据集是一个用于内部测试的临时数据集,包含两个配置:speech_clean和speech_noisy。每个配置都包含来自不同音频来源的数据(如口部佩戴的参考麦克风、额头上的微型加速度计等),以及相关的元数据(如性别、说话者ID、句子ID、持续时间、原始文本、标准化文本和音素化文本)。speech_clean配置的测试集包含1979个样本,speech_noisy配置的测试集包含69个样本。
提供机构:
Cnam-LMSSC
原始信息汇总

数据集概述

配置名称:speech_clean

  • 特征:
    • audio.airborne.mouth_headworn.reference_microphone: 音频类型
    • audio.body_conducted.forehead.miniature_accelerometer: 音频类型
    • audio.body_conducted.in_ear.comply_foam_microphone: 音频类型
    • audio.body_conducted.in_ear.rigid_earpiece_microphone: 音频类型
    • audio.body_conducted.temple.contact_microphone: 音频类型
    • audio.body_conducted.throat.piezoelectric_sensor: 音频类型
    • gender: 字符串类型
    • speaker_id: 字符串类型
    • sentence_id: 整数64位类型
    • duration: 浮点64位类型
    • raw_text: 字符串类型
    • normalized_text: 字符串类型
    • phonemized_text: 字符串类型
  • 分割:
    • test:
      • 字节数: 2316373575.125
      • 示例数: 1979
  • 下载大小: 2052539050
  • 数据集大小: 2316373575.125

配置名称:speech_noisy

  • 特征:
    • audio.airborne.mouth_headworn.reference_microphone: 音频类型
    • audio.body_conducted.forehead.miniature_accelerometer: 音频类型
    • audio.body_conducted.in_ear.comply_foam_microphone: 音频类型
    • audio.body_conducted.in_ear.rigid_earpiece_microphone: 音频类型
    • audio.body_conducted.temple.contact_microphone: 音频类型
    • audio.body_conducted.throat.piezoelectric_sensor: 音频类型
    • gender: 字符串类型
    • speaker_id: 字符串类型
    • sentence_id: 整数64位类型
    • duration: 浮点64位类型
    • raw_text: 字符串类型
    • normalized_text: 字符串类型
    • phonemized_text: 字符串类型
  • 分割:
    • test:
      • 字节数: 84811551.0
      • 示例数: 69
  • 下载大小: 83025636
  • 数据集大小: 84811551.0
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作