Gummybear05/E10_Yspeed
收藏Hugging Face2023-12-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Gummybear05/E10_Yspeed
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频和文本数据,以及相关的元数据信息。音频数据包括数组、路径和采样率,文本数据包括对话内容。其他元数据包括脚本ID、文件名、录音时间、录音质量、录音日期、脚本集编号、录音环境、采集单位代码、城市代码、录音单位、对话主题、性别、录音者ID和年龄。数据集分为一个训练集,包含12401个样本,总大小为11044951918字节。
该数据集包含音频和文本数据,以及相关的元数据信息。音频数据包括数组、路径和采样率,文本数据包括对话内容。其他元数据包括脚本ID、文件名、录音时间、录音质量、录音日期、脚本集编号、录音环境、采集单位代码、城市代码、录音单位、对话主题、性别、录音者ID和年龄。数据集分为一个训练集,包含12401个样本,总大小为11044951918字节。
提供机构:
Gummybear05
原始信息汇总
数据集概述
数据集特征
- audio:
- array: 序列类型为
float64 - path: 数据类型为
string - sample_rate: 数据类型为
int64
- array: 序列类型为
- text: 数据类型为
string - scriptId: 数据类型为
int64 - fileNm: 数据类型为
string - recrdTime: 数据类型为
float64 - recrdQuality: 数据类型为
int64 - recrdDt: 数据类型为
string - scriptSetNo: 数据类型为
string - recrdEnvrn: 数据类型为
string - colctUnitCode: 数据类型为
string - cityCode: 数据类型为
string - recrdUnit: 数据类型为
string - convrsThema: 数据类型为
string - gender: 数据类型为
string - recorderId: 数据类型为
string - age: 数据类型为
int64
数据集划分
- train:
- num_bytes: 11044951918
- num_examples: 12401
数据集大小
- download_size: 7867337546
- dataset_size: 11044951918
配置
- default:
- data_files:
- split: train
- path: data/train-*
- data_files:



