isabelarvelo/test_upload
收藏Hugging Face2024-02-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/isabelarvelo/test_upload
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频数据及其相关元信息,如节目名称、剪辑ID、时间戳、说话者信息等。此外,数据集还包含对音频质量的评估(如音频质量差、延长、阻塞等)以及流畅度的评估(如流畅、自然停顿、音乐等)。数据集分为训练集、验证集、测试集和排除集,分别包含10765、4181、3806和3104个样本。
该数据集包含音频数据及其相关元信息,如节目名称、剪辑ID、时间戳、说话者信息等。此外,数据集还包含对音频质量的评估(如音频质量差、延长、阻塞等)以及流畅度的评估(如流畅、自然停顿、音乐等)。数据集分为训练集、验证集、测试集和排除集,分别包含10765、4181、3806和3104个样本。
提供机构:
isabelarvelo
原始信息汇总
数据集概述
特征信息
- audio:
- array: 序列类型为
float64 - path: 数据类型为
string - sampling_rate: 数据类型为
int64
- array: 序列类型为
- Show: 数据类型为
string - EpId: 数据类型为
string - ClipId: 数据类型为
string - Start: 数据类型为
string - Stop: 数据类型为
string - is_probably_host: 数据类型为
string - speaker: 数据类型为
string - clip_silhouette_score: 数据类型为
string - SEP12k: 数据类型为
string - SEP28k-E: 数据类型为
string - SEP28k-T: 数据类型为
string - SEP28k-D: 数据类型为
string - Unsure: 数据类型为
int64 - PoorAudioQuality: 数据类型为
int64 - Prolongation: 数据类型为
int64 - Block: 数据类型为
int64 - SoundRep: 数据类型为
int64 - WordRep: 数据类型为
int64 - DifficultToUnderstand: 数据类型为
int64 - Interjection: 数据类型为
int64 - Fluent: 数据类型为
int64 - NaturalPause: 数据类型为
int64 - Music: 数据类型为
int64 - NoSpeech: 数据类型为
int64 - Stuttered: 数据类型为
int64 - Stuttered_no_Intj: 数据类型为
int64 - Fluent_no_Intj: 数据类型为
int64 - Fluent_with_Intj: 数据类型为
int64 - Stuttered_Intj: 数据类型为
int64 - Exclude: 数据类型为
int64 - Label_4: 数据类型为
string - Label_2: 数据类型为
string - index_level_0: 数据类型为
int64
数据分割
- train:
- 字节数: 4137510281
- 样本数: 10765
- validation:
- 字节数: 1606918656
- 样本数: 4181
- test:
- 字节数: 1462837083
- 样本数: 3806
- exclude:
- 字节数: 1192241999
- 样本数: 3104
数据集大小
- 下载大小: 1964692285 字节
- 数据集大小: 8399508019 字节
配置信息
- default:
- train: 路径为
data/train-* - validation: 路径为
data/validation-* - test: 路径为
data/test-* - exclude: 路径为
data/exclude-*
- train: 路径为



