Lib-set

Name: Lib-set
Creator: maas
Published: 2025-12-04 16:16:46
License: 暂无描述

魔搭社区2025-12-04 更新2025-06-14 收录

下载链接：

https://modelscope.cn/datasets/HuangQS/Lib-set

下载链接

链接失效反馈

官方服务：

资源简介：

license: Apache License 2.0 audio: few_shot_speaker_recognition: languages: - en - fr sampling_rates: - 16000  ---   ## 数据集描述 - 本数据集采样自开源数据集[Librispeech](https://www.openslr.org/12/)train-clean-100和train-clean500中样本，数据格式为.wav，采样率为16000kHz，未进行归一化，分为训练集，验证集和测试集。 - 训练集包含921个不同说话人，每个说话人20个样本。测试集包含300个不同说话人，每个说话人20个样本 ## 数据集的格式和结构 - data ├── train │&ensp;&ensp;&ensp;&ensp;├──train_list.txt └── test&ensp;&ensp;&ensp;&ensp;&ensp;├──test_list.txt &ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp; *。txt文件中保存了所用到的样本。 ## 数据集加载方式请参阅ModelScope[官方教程](https://www.modelscope.cn/docs/%E6%95%B0%E6%8D%AE%E9%9B%86%E7%9A%84%E4%B8%8B%E8%BD%BD)

许可证：Apache License 2.0 音频任务：少样本说话人识别（few_shot_speaker_recognition）支持语言： - 英语（en） - 法语（fr）采样率： - 16000（整数类型） ---  ## 数据集描述 - 本数据集采样自开源数据集[Librispeech](https://www.openslr.org/12/)的train-clean-100与train-clean-500子集，数据格式为.wav格式，采样率为16000Hz（原文疑似笔误，原标注为16000kHz，语音领域标准采样率应为16000Hz即16kHz），未进行归一化处理，划分为训练集、验证集与测试集。 - 训练集包含921名不同说话人，每名说话人对应20条语音样本；测试集包含300名不同说话人，每名说话人对应20条语音样本。 ## 数据集格式与结构 - 数据集目录结构如下： data ├── train │ ├── train_list.txt └── test ├── test_list.txt * 各.txt文件中存储了对应子集所使用的样本信息。 ## 数据集加载方式请参阅ModelScope[官方教程](https://www.modelscope.cn/docs/%E6%95%B0%E6%8D%AE%E9%9B%86%E7%9A%84%E4%B8%8B%E8%BD%BD)

提供机构：

maas

创建时间：

2024-08-20

5,000+

优质数据集

54 个

任务类型

进入经典数据集