Gummybear05/Y_normal
收藏Hugging Face2023-12-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Gummybear05/Y_normal
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频和文本数据,音频数据包括音频数组、路径和采样率,文本数据包括脚本ID、文件名、录音时间、录音质量、录音日期、脚本集编号、录音环境、采集单位代码、城市代码、录音单位、对话主题、性别、录音者ID和年龄等信息。数据集分为训练集和测试集,训练集有12401个样本,测试集有605个样本。数据集的下载大小为2181835743字节,总大小为9959002075字节。
该数据集包含音频和文本数据,音频数据包括音频数组、路径和采样率,文本数据包括脚本ID、文件名、录音时间、录音质量、录音日期、脚本集编号、录音环境、采集单位代码、城市代码、录音单位、对话主题、性别、录音者ID和年龄等信息。数据集分为训练集和测试集,训练集有12401个样本,测试集有605个样本。数据集的下载大小为2181835743字节,总大小为9959002075字节。
提供机构:
Gummybear05
原始信息汇总
数据集概述
数据特征
- audio:
- array: 序列类型为 float64
- path: 数据类型为 string
- sample_rate: 数据类型为 int64
- text: 数据类型为 string
- scriptId: 数据类型为 int64
- fileNm: 数据类型为 string
- recrdTime: 数据类型为 float64
- recrdQuality: 数据类型为 int64
- recrdDt: 数据类型为 string
- scriptSetNo: 数据类型为 string
- recrdEnvrn: 数据类型为 string
- colctUnitCode: 数据类型为 string
- cityCode: 数据类型为 string
- recrdUnit: 数据类型为 string
- convrsThema: 数据类型为 string
- gender: 数据类型为 string
- recorderId: 数据类型为 string
- age: 数据类型为 int64
数据分割
- train:
- 字节数: 9454815261
- 样本数: 12401
- test:
- 字节数: 504186814
- 样本数: 605
数据大小
- 下载大小: 2181835743 字节
- 数据集大小: 9959002075 字节
配置
- default:
- train: 路径为 data/train-*
- test: 路径为 data/test-*



