five

Lib-set

收藏
魔搭社区2025-12-04 更新2025-06-14 收录
下载链接:
https://modelscope.cn/datasets/HuangQS/Lib-set
下载链接
链接失效反馈
官方服务:
资源简介:
license: Apache License 2.0 audio: few_shot_speaker_recognition: languages: - en - fr sampling_rates: - 16000 <!--- integer ---> --- <!--- 以上YAML section提供属性/tags描述---> <!--- 以下为markdown格式的dataset描述---> ## 数据集描述 - 本数据集采样自开源数据集[Librispeech](https://www.openslr.org/12/)train-clean-100和train-clean500中样本,数据格式为.wav,采样率为16000kHz,未进行归一化,分为训练集,验证集和测试集。</br> - 训练集包含921个不同说话人,每个说话人20个样本。 测试集包含300个不同说话人,每个说话人20个样本 ## 数据集的格式和结构 - data </br> ├── train</br> │&ensp;&ensp;&ensp;&ensp;├──train_list.txt</br> └── test</br>&ensp;&ensp;&ensp;&ensp;&ensp;├──test_list.txt &ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;&ensp;</br> *。txt文件中保存了所用到的样本。 ## 数据集加载方式 请参阅ModelScope[官方教程](https://www.modelscope.cn/docs/%E6%95%B0%E6%8D%AE%E9%9B%86%E7%9A%84%E4%B8%8B%E8%BD%BD)

许可证:Apache License 2.0 音频任务:少样本说话人识别(few_shot_speaker_recognition) 支持语言: - 英语(en) - 法语(fr) 采样率: - 16000(整数类型) --- <!--- 以上为数据集属性与标签的YAML描述 ---> ## 数据集描述 - 本数据集采样自开源数据集[Librispeech](https://www.openslr.org/12/)的train-clean-100与train-clean-500子集,数据格式为.wav格式,采样率为16000Hz(原文疑似笔误,原标注为16000kHz,语音领域标准采样率应为16000Hz即16kHz),未进行归一化处理,划分为训练集、验证集与测试集。 - 训练集包含921名不同说话人,每名说话人对应20条语音样本;测试集包含300名不同说话人,每名说话人对应20条语音样本。 ## 数据集格式与结构 - 数据集目录结构如下: data ├── train │ ├── train_list.txt └── test ├── test_list.txt * 各.txt文件中存储了对应子集所使用的样本信息。 ## 数据集加载方式 请参阅ModelScope[官方教程](https://www.modelscope.cn/docs/%E6%95%B0%E6%8D%AE%E9%9B%86%E7%9A%84%E4%B8%8B%E8%BD%BD)
提供机构:
maas
创建时间:
2024-08-20
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作