five

Aadhitya/audioData

收藏
Hugging Face2024-07-08 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Aadhitya/audioData
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含音频文件及其对应的转录文本,每个音频文件还标注了说话者的性别和唯一的说话者ID。数据集被划分为一个训练集,包含260个样本,总大小为696,784,802字节。该数据集可能用于语音识别、说话者识别或性别分类等任务。

The dataset includes four features: audio files, transcription text, speaker gender, and speaker ID. Audio files are stored in audio format, transcription text is in string format, gender is in string format, and speaker ID is in integer format. The dataset is divided into a training set with 260 samples, totaling 696784802 bytes. The download size of the dataset is 600924957 bytes.
提供机构:
Aadhitya
原始信息汇总

数据集概述

数据集特征

  • audio: 音频数据,数据类型为 audio
  • transcription: 转录文本,数据类型为 string
  • gender: 性别信息,数据类型为 string
  • speaker_id: 说话者ID,数据类型为 int64

数据集分割

  • train: 训练集,包含 260 个样本,总大小为 696784802.0 字节。

数据集大小

  • 下载大小: 600924957 字节
  • 总大小: 696784802.0 字节

配置

  • default: 默认配置,包含训练集数据文件路径 data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作