Lib-set
收藏魔搭社区2025-12-04 更新2025-06-14 收录
下载链接:
https://modelscope.cn/datasets/HuangQS/Lib-set
下载链接
链接失效反馈官方服务:
资源简介:
license: Apache License 2.0
audio:
few_shot_speaker_recognition:
languages:
- en
- fr
sampling_rates:
- 16000 <!--- integer --->
---
<!--- 以上YAML section提供属性/tags描述--->
<!--- 以下为markdown格式的dataset描述--->
## 数据集描述
- 本数据集采样自开源数据集[Librispeech](https://www.openslr.org/12/)train-clean-100和train-clean500中样本,数据格式为.wav,采样率为16000kHz,未进行归一化,分为训练集,验证集和测试集。</br>
- 训练集包含921个不同说话人,每个说话人20个样本。
测试集包含300个不同说话人,每个说话人20个样本
## 数据集的格式和结构
- data </br>
├── train</br>
│    ├──train_list.txt</br>
└── test</br>     ├──test_list.txt
         </br>
*。txt文件中保存了所用到的样本。
## 数据集加载方式
请参阅ModelScope[官方教程](https://www.modelscope.cn/docs/%E6%95%B0%E6%8D%AE%E9%9B%86%E7%9A%84%E4%B8%8B%E8%BD%BD)
许可证:Apache License 2.0
音频任务:少样本说话人识别(few_shot_speaker_recognition)
支持语言:
- 英语(en)
- 法语(fr)
采样率:
- 16000(整数类型)
---
<!--- 以上为数据集属性与标签的YAML描述 --->
## 数据集描述
- 本数据集采样自开源数据集[Librispeech](https://www.openslr.org/12/)的train-clean-100与train-clean-500子集,数据格式为.wav格式,采样率为16000Hz(原文疑似笔误,原标注为16000kHz,语音领域标准采样率应为16000Hz即16kHz),未进行归一化处理,划分为训练集、验证集与测试集。
- 训练集包含921名不同说话人,每名说话人对应20条语音样本;测试集包含300名不同说话人,每名说话人对应20条语音样本。
## 数据集格式与结构
- 数据集目录结构如下:
data
├── train
│ ├── train_list.txt
└── test
├── test_list.txt
* 各.txt文件中存储了对应子集所使用的样本信息。
## 数据集加载方式
请参阅ModelScope[官方教程](https://www.modelscope.cn/docs/%E6%95%B0%E6%8D%AE%E9%9B%86%E7%9A%84%E4%B8%8B%E8%BD%BD)
提供机构:
maas
创建时间:
2024-08-20



