101arrowz/vox_celeb

Name: 101arrowz/vox_celeb
Creator: 101arrowz
Published: 2023-08-20 03:04:07
License: 暂无描述

Hugging Face2023-08-20 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/101arrowz/vox_celeb

下载链接

链接失效反馈

官方服务：

资源简介：

VoxCeleb是一个音频-视觉数据集，包含从YouTube上传的采访视频中提取的人类语音短片。每个数据点包括音频/视频剪辑的路径以及关于说话者的元数据，如说话者ID、性别、姓名、国籍等。数据集支持的任务包括自动语音识别、音频分类和图像分类。数据集是多语言的，由众包创建，并遵循CC-BY-4.0许可证。

提供机构：

101arrowz

原始信息汇总

数据集概述

名称: VoxCeleb

类型: 音频-视觉数据集

内容: 包含从YouTube上的访谈视频中提取的人类语音短片段。

数据结构:

数据实例: 每个数据点包含音频/视频剪辑的路径及演讲者的元数据。
数据字段: 包括文件路径、文件格式、数据集ID、演讲者ID、性别、名称、国籍、视频ID、剪辑索引及音频信号数据。
数据分割: 预定义的开发集和测试集，其中开发集已重命名为“训练”分割。

语言: 多语言

任务类别:

自动语音识别
音频分类
图像分类

任务ID: 说话人识别

许可证: cc-by-4.0

数据集创建:

注释创建者: 众包
语言创建者: 众包
个人和敏感信息: 数据集包含来自公开YouTube视频的剪辑记录，主要涉及名人和公众人物。VoxCeleb1中提供了演讲者的姓名。

使用考虑:

引用信息: 使用VoxCeleb1或VoxCeleb2时，需引用以下三篇文献：
- Nagrani19
- Chung18b
- Nagrani17

贡献者: 感谢@101arrowz添加此数据集。

搜集汇总

数据集介绍

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集