jp1924/NaturalandArtificialOccurrenceNonverbalSoundDatasets
收藏Hugging Face2024-06-14 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/jp1924/NaturalandArtificialOccurrenceNonverbalSoundDatasets
下载链接
链接失效反馈官方服务:
资源简介:
该数据集主要包含噪声数据,数据集中每个样本都包含多个信息字段,如原始数据信息(RawDataInfo)、源数据信息(SourceDataInfo)、标签数据信息(LabelDataInfo)以及音频数据(audio)。数据集分为训练集和验证集,总下载大小约为20.62GB,数据集总大小约为22.63GB。数据集适用于自动语音识别任务,语言为韩语,标签包括STT、Audio和Noise。数据集中噪声前包含特定的语音信息,需要在预处理时特别注意。
该数据集主要包含噪声数据,数据集中每个样本都包含多个信息字段,如原始数据信息(RawDataInfo)、源数据信息(SourceDataInfo)、标签数据信息(LabelDataInfo)以及音频数据(audio)。数据集分为训练集和验证集,总下载大小约为20.62GB,数据集总大小约为22.63GB。数据集适用于自动语音识别任务,语言为韩语,标签包括STT、Audio和Noise。数据集中噪声前包含特定的语音信息,需要在预处理时特别注意。
提供机构:
jp1924
原始信息汇总
数据集概述
特征信息
- RawDataInfo
- RawDataId: 字符串
- Copyrighter: 字符串
- SampleRate(Hz): 32位整数
- Channel: 32位整数
- BitDepth(bit): 32位整数
- RecordingDevice: 字符串
- BitRate(kbps): 32位整数
- CollectionType: 字符串
- RecDateTime: 字符串
- RecDataLength(sec): 32位整数
- Season: 字符串
- Weather: 字符串
- TimeZone: 字符串
- PlaceType: 字符串
- DistanceType: 字符串
- FileExtension: 字符串
- SourceDataInfo
- SourceDataId: 字符串
- FileExtension: 字符串
- NoOfClip: 32位整数
- ClipDataLength(sec): 32位整数
- LabelDataInfo
- Path: 字符串
- LabelID: 字符串
- NumAnnotator: 32位整数
- Division1: 字符串
- Division2: 字符串
- Class: 字符串
- Desc: 字符串
- Type: 字符串
- NumSegmentation: 32位整数
- Segmentations: 浮点数序列
- audio
- 采样率: 44100 Hz
数据分割
- train
- 字节数: 20358466791
- 样本数: 35848
- validation
- 字节数: 2273622062.875
- 样本数: 4481
数据集大小
- 下载大小: 20620542669
- 数据集大小: 22632088853.875
配置信息
- default
- 训练数据路径: data/train-*
- 验证数据路径: data/validation-*
任务类别
- 自动语音识别
语言
- 韩语
标签
- STT
- Audio
- Noise
数据集大小类别
- 10B<n<100B



