zinc75/Vibravox_dummy
收藏Hugging Face2023-11-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/zinc75/Vibravox_dummy
下载链接
链接失效反馈官方服务:
资源简介:
VibraVox数据集是一个法语单语种数据集,主要用于音频处理任务,包括音频到音频转换、自动语音识别、音频分类和文本到语音转换。数据集由专家和众包人员共同创建,大小在10K到100K之间。数据集包含多个配置,每个配置都有训练、验证和测试集,特征包括音频、转录文本、传感器ID、说话者ID、性别、类型和分割信息。
VibraVox数据集是一个法语单语种数据集,主要用于音频处理任务,包括音频到音频转换、自动语音识别、音频分类和文本到语音转换。数据集由专家和众包人员共同创建,大小在10K到100K之间。数据集包含多个配置,每个配置都有训练、验证和测试集,特征包括音频、转录文本、传感器ID、说话者ID、性别、类型和分割信息。
提供机构:
zinc75
原始信息汇总
数据集概述
基本信息
- 数据集名称: VibraVox
- 语言: 法语
- 许可证: CC BY 4.0
- 多语言性: 单语种
- 数据集大小: 10K<n<100K
任务类别
- 音频到音频
- 自动语音识别
- 音频分类
- 文本到语音
具体任务
- 说话人识别
配置信息
配置名称: ASR_Headworn_mouth_microphone
- 数据文件:
- 训练集: ASR_Headworn_mouth_microphone/train-*
- 验证集: ASR_Headworn_mouth_microphone/validation-*
- 测试集: ASR_Headworn_mouth_microphone/test-*
- 特征:
- 音频: 音频类型
- 转录: 字符串类型
- 传感器ID: 字符串类型
- 说话人ID: 字符串类型
- 性别: 字符串类型
- 类型: 字符串类型
- 分割: 字符串类型
- 分割信息:
- 训练集: 8个样本, 5335254字节
- 验证集: 1个样本, 695227字节
- 测试集: 1个样本, 704461字节
- 下载大小: 0字节
- 数据集大小: 6734942字节
配置名称: ASR_Larynx_microphone
- 数据文件:
- 训练集: ASR_Larynx_microphone/train-*
- 验证集: ASR_Larynx_microphone/validation-*
- 测试集: ASR_Larynx_microphone/test-*
- 特征:
- 音频: 音频类型
- 转录: 字符串类型
- 传感器ID: 字符串类型
- 说话人ID: 字符串类型
- 性别: 字符串类型
- 类型: 字符串类型
- 分割: 字符串类型
- 分割信息:
- 训练集: 8个样本, 5335110字节
- 验证集: 1个样本, 695209字节
- 测试集: 1个样本, 704443字节
- 下载大小: 6585432字节
- 数据集大小: 6734762字节
配置名称: BWE_Larynx_microphone
- 数据文件:
- 训练集: BWE_Larynx_microphone/train-*
- 验证集: BWE_Larynx_microphone/validation-*
- 测试集: BWE_Larynx_microphone/test-*
- 特征:
- 音频: 音频类型, 非单声道
- 转录: 字符串类型
- 传感器ID: 字符串类型
- 说话人ID: 字符串类型
- 性别: 字符串类型
- 类型: 字符串类型
- 分割: 字符串类型
- 分割信息:
- 训练集: 8个样本, 5335110字节
- 验证集: 1个样本, 695209字节
- 测试集: 1个样本, 704443字节
- 下载大小: 6083859字节
- 数据集大小: 6734762字节



