101arrowz/vox_celeb
收藏Hugging Face2023-08-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/101arrowz/vox_celeb
下载链接
链接失效反馈官方服务:
资源简介:
VoxCeleb是一个音频-视觉数据集,包含从YouTube上传的采访视频中提取的人类语音短片。每个数据点包括音频/视频剪辑的路径以及关于说话者的元数据,如说话者ID、性别、姓名、国籍等。数据集支持的任务包括自动语音识别、音频分类和图像分类。数据集是多语言的,由众包创建,并遵循CC-BY-4.0许可证。
提供机构:
101arrowz
原始信息汇总
数据集概述
名称: VoxCeleb
类型: 音频-视觉数据集
内容: 包含从YouTube上的访谈视频中提取的人类语音短片段。
数据结构:
- 数据实例: 每个数据点包含音频/视频剪辑的路径及演讲者的元数据。
- 数据字段: 包括文件路径、文件格式、数据集ID、演讲者ID、性别、名称、国籍、视频ID、剪辑索引及音频信号数据。
- 数据分割: 预定义的开发集和测试集,其中开发集已重命名为“训练”分割。
语言: 多语言
任务类别:
- 自动语音识别
- 音频分类
- 图像分类
任务ID: 说话人识别
许可证: cc-by-4.0
数据集创建:
- 注释创建者: 众包
- 语言创建者: 众包
- 个人和敏感信息: 数据集包含来自公开YouTube视频的剪辑记录,主要涉及名人和公众人物。VoxCeleb1中提供了演讲者的姓名。
使用考虑:
- 引用信息: 使用VoxCeleb1或VoxCeleb2时,需引用以下三篇文献:
- Nagrani19
- Chung18b
- Nagrani17
贡献者: 感谢@101arrowz添加此数据集。
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



