Milana/resampled_shuffled_vctk_only_audio
收藏Hugging Face2024-05-13 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Milana/resampled_shuffled_vctk_only_audio
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个字段,包括说话者ID、文本ID、口音、地区、国家以及重采样的音频数据。数据集被划分为训练集和测试集,训练集包含66026个示例,测试集包含17066个示例。数据集的总下载大小为35729169374字节,总大小为35687366462字节。该数据集可能用于语音识别、口音分析或地区语言研究等领域。
该数据集包含多个字段,包括说话者ID、文本ID、口音、地区、国家以及重采样的音频数据。数据集被划分为训练集和测试集,训练集包含66026个示例,测试集包含17066个示例。数据集的总下载大小为35729169374字节,总大小为35687366462字节。该数据集可能用于语音识别、口音分析或地区语言研究等领域。
提供机构:
Milana
原始信息汇总
数据集概述
数据集特征
- speaker_id: 数据类型为字符串。
- text_id: 数据类型为字符串。
- accent: 数据类型为字符串。
- region: 数据类型为字符串。
- country: 数据类型为字符串。
- resampled_audio: 数据类型为浮点数序列。
数据集分割
- 训练集:
- 大小: 28132050534 字节
- 示例数量: 66026
- 测试集:
- 大小: 7555315928 字节
- 示例数量: 17066
数据集大小
- 下载大小: 35729169374 字节
- 数据集总大小: 35687366462 字节
配置文件
- 默认配置:
- 训练数据路径:
data/train-* - 测试数据路径:
data/test-*
- 训练数据路径:



