V2-set

Name: V2-set
Creator: maas
Published: 2025-05-25 07:05:33
License: 暂无描述

魔搭社区2025-05-25 更新2024-08-31 收录

下载链接：

https://modelscope.cn/datasets/HuangQS/V2-set

下载链接

链接失效反馈

官方服务：

资源简介：

# V2-set README ## Overview ### This dataset is sampled from the open source dataset [voxceleb1](https://www.robots.ox.ac.uk/~vgg/data/voxceleb/). The configuration of this dataset is listed below: - format: wav - Sample rate: 16000kHz - Number of Speakers in training/test set:2000/300 - Samples per speaker in training/test:20 - Normalization: None ## Structure - data ├── train │&ensp;&ensp;&ensp;&ensp;├──id0000x │&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;├──*.wav └── test&ensp;&ensp;&ensp;&ensp;&ensp;├──id000z &ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;├──*.wav ## How to use Please refer to the official tutorial [Official Tutorial](https://www.modelscope.cn/docs/%E6%95%B0%E6%8D%AE%E9%9B%86%E7%9A%84%E4%B8%8B%E8%BD%BD)

# V2数据集说明文档 ## 概述 ### 本数据集采样自开源数据集[voxceleb1](https://www.robots.ox.ac.uk/~vgg/data/voxceleb/)。本数据集的配置信息如下： - 音频格式：WAV - 采样率：16000kHz - 训练集与测试集的说话人数量分别为2000与300 - 训练集与测试集下每位说话人的样本数均为20 - 归一化处理：无 ## 数据集结构 - 数据目录（data） ├── 训练集目录（train） │&ensp;&ensp;&ensp;&ensp;├── 说话人ID目录（id0000x） │&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;├── 所有WAV格式音频文件（*.wav） └── 测试集目录（test） &ensp;&ensp;&ensp;&ensp;&ensp;├── 说话人ID目录（id000z） &ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;├── 所有WAV格式音频文件（*.wav） ## 使用方法请参考官方教程[官方教程](https://www.modelscope.cn/docs/%E6%95%B0%E6%8D%AE%E9%9B%86%E7%9A%84%E4%B8%8B%E8%BD%BD)

提供机构：

maas

创建时间：

2024-08-18

5,000+

优质数据集

54 个

任务类型

进入经典数据集