Milana/resampled_16KHrz_vctk_speakers_split
收藏Hugging Face2024-05-08 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Milana/resampled_16KHrz_vctk_speakers_split
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如说话者ID、音频、文件、文本、文本ID、年龄、性别、口音、地区、评论、国家和重采样音频。数据集分为训练集和测试集,分别包含66026和17066个样本。数据集的下载大小为61789845382字节,总大小为62472374016.408字节。
该数据集包含多个特征,如说话者ID、音频、文件、文本、文本ID、年龄、性别、口音、地区、评论、国家和重采样音频。数据集分为训练集和测试集,分别包含66026和17066个样本。数据集的下载大小为61789845382字节,总大小为62472374016.408字节。
提供机构:
Milana
原始信息汇总
数据集概述
数据集特征
- speaker_id: 字符串类型
- audio: 音频类型,采样率为48000
- file: 字符串类型
- text: 字符串类型
- text_id: 字符串类型
- age: 字符串类型
- gender: 字符串类型
- accent: 字符串类型
- region: 字符串类型
- comment: 字符串类型
- country: 字符串类型
- resampled_audio: 序列类型,序列元素为float64
数据集分割
- train: 包含66026个样本,总大小为49246544243.724字节
- test: 包含17066个样本,总大小为13225829772.684字节
数据集大小
- 下载大小: 61789845382字节
- 数据集总大小: 62472374016.408字节
数据文件配置
- default 配置:
- train 数据路径:
data/train-* - test 数据路径:
data/test-*
- train 数据路径:



