five

V2-set

收藏
魔搭社区2025-05-25 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/HuangQS/V2-set
下载链接
链接失效反馈
官方服务:
资源简介:
# V2-set README ## Overview ### This dataset is sampled from the open source dataset [voxceleb1](https://www.robots.ox.ac.uk/~vgg/data/voxceleb/). The configuration of this dataset is listed below:</br> - format: wav - Sample rate: 16000kHz - Number of Speakers in training/test set:2000/300 - Samples per speaker in training/test:20 - Normalization: None ## Structure - data </br> ├── train</br> │&ensp;&ensp;&ensp;&ensp;├──id0000x</br> │&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;├──*.wav</br> └── test</br>&ensp;&ensp;&ensp;&ensp;&ensp;├──id000z &ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;</br>&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;├──*.wav</br> ## How to use Please refer to the official tutorial [Official Tutorial](https://www.modelscope.cn/docs/%E6%95%B0%E6%8D%AE%E9%9B%86%E7%9A%84%E4%B8%8B%E8%BD%BD)

# V2数据集 说明文档 ## 概述 ### 本数据集采样自开源数据集[voxceleb1](https://www.robots.ox.ac.uk/~vgg/data/voxceleb/)。本数据集的配置信息如下: - 音频格式:WAV - 采样率:16000kHz - 训练集与测试集的说话人数量分别为2000与300 - 训练集与测试集下每位说话人的样本数均为20 - 归一化处理:无 ## 数据集结构 - 数据目录(data) ├── 训练集目录(train) │&ensp;&ensp;&ensp;&ensp;├── 说话人ID目录(id0000x) │&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;├── 所有WAV格式音频文件(*.wav) └── 测试集目录(test) &ensp;&ensp;&ensp;&ensp;&ensp;├── 说话人ID目录(id000z) &ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;├── 所有WAV格式音频文件(*.wav) ## 使用方法 请参考官方教程[官方教程](https://www.modelscope.cn/docs/%E6%95%B0%E6%8D%AE%E9%9B%86%E7%9A%84%E4%B8%8B%E8%BD%BD)
提供机构:
maas
创建时间:
2024-08-18
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作