Cnam-LMSSC/vibravox_enhanced_by_EBEN_tmp
收藏Hugging Face2024-05-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Cnam-LMSSC/vibravox_enhanced_by_EBEN_tmp
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个用于内部测试的临时数据集,包含两个配置:speech_clean和speech_noisy。每个配置都包含来自不同音频来源的数据(如口部佩戴的参考麦克风、额头上的微型加速度计等),以及相关的元数据(如性别、说话者ID、句子ID、持续时间、原始文本、标准化文本和音素化文本)。speech_clean配置的测试集包含1979个样本,speech_noisy配置的测试集包含69个样本。
该数据集是一个用于内部测试的临时数据集,包含两个配置:speech_clean和speech_noisy。每个配置都包含来自不同音频来源的数据(如口部佩戴的参考麦克风、额头上的微型加速度计等),以及相关的元数据(如性别、说话者ID、句子ID、持续时间、原始文本、标准化文本和音素化文本)。speech_clean配置的测试集包含1979个样本,speech_noisy配置的测试集包含69个样本。
提供机构:
Cnam-LMSSC
原始信息汇总
数据集概述
配置名称:speech_clean
- 特征:
audio.airborne.mouth_headworn.reference_microphone: 音频类型audio.body_conducted.forehead.miniature_accelerometer: 音频类型audio.body_conducted.in_ear.comply_foam_microphone: 音频类型audio.body_conducted.in_ear.rigid_earpiece_microphone: 音频类型audio.body_conducted.temple.contact_microphone: 音频类型audio.body_conducted.throat.piezoelectric_sensor: 音频类型gender: 字符串类型speaker_id: 字符串类型sentence_id: 整数64位类型duration: 浮点64位类型raw_text: 字符串类型normalized_text: 字符串类型phonemized_text: 字符串类型
- 分割:
test:- 字节数: 2316373575.125
- 示例数: 1979
- 下载大小: 2052539050
- 数据集大小: 2316373575.125
配置名称:speech_noisy
- 特征:
audio.airborne.mouth_headworn.reference_microphone: 音频类型audio.body_conducted.forehead.miniature_accelerometer: 音频类型audio.body_conducted.in_ear.comply_foam_microphone: 音频类型audio.body_conducted.in_ear.rigid_earpiece_microphone: 音频类型audio.body_conducted.temple.contact_microphone: 音频类型audio.body_conducted.throat.piezoelectric_sensor: 音频类型gender: 字符串类型speaker_id: 字符串类型sentence_id: 整数64位类型duration: 浮点64位类型raw_text: 字符串类型normalized_text: 字符串类型phonemized_text: 字符串类型
- 分割:
test:- 字节数: 84811551.0
- 示例数: 69
- 下载大小: 83025636
- 数据集大小: 84811551.0



