Aadhitya/audioData
收藏Hugging Face2024-07-08 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Aadhitya/audioData
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频文件及其对应的转录文本,每个音频文件还标注了说话者的性别和唯一的说话者ID。数据集被划分为一个训练集,包含260个样本,总大小为696,784,802字节。该数据集可能用于语音识别、说话者识别或性别分类等任务。
The dataset includes four features: audio files, transcription text, speaker gender, and speaker ID. Audio files are stored in audio format, transcription text is in string format, gender is in string format, and speaker ID is in integer format. The dataset is divided into a training set with 260 samples, totaling 696784802 bytes. The download size of the dataset is 600924957 bytes.
提供机构:
Aadhitya
原始信息汇总
数据集概述
数据集特征
- audio: 音频数据,数据类型为
audio。 - transcription: 转录文本,数据类型为
string。 - gender: 性别信息,数据类型为
string。 - speaker_id: 说话者ID,数据类型为
int64。
数据集分割
- train: 训练集,包含 260 个样本,总大小为 696784802.0 字节。
数据集大小
- 下载大小: 600924957 字节
- 总大小: 696784802.0 字节
配置
- default: 默认配置,包含训练集数据文件路径
data/train-*。



