awajai/phase2-stt-slr143
收藏Hugging Face2024-07-14 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/awajai/phase2-stt-slr143
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频、句子、路径、输入长度、输入特征、标签和标签长度等特征。数据集分为训练集,包含675个样本,总大小为1180904778字节。下载大小为392613248字节。配置文件指定了数据文件的路径。
This dataset is primarily used for speech recognition tasks, containing audio, text, and related metadata. The audio features have a sampling rate of 16000 Hz, suitable for high-precision speech processing. The dataset structure includes a training set with 675 samples, each containing audio, corresponding sentence, file path, input length, input features, labels, and labels length. The download size of the dataset is 392613248 bytes, and the total size is 1180904778 bytes.
提供机构:
awajai
原始信息汇总
数据集概述
数据集特征
- audio: 音频数据,采样率为16000。
- sentence: 字符串类型,表示句子。
- path: 字符串类型,表示路径。
- input_length: 整数类型,表示输入长度。
- input_features: 序列类型,包含浮点数。
- labels: 序列类型,包含整数。
- labels_length: 整数类型,表示标签长度。
数据集分割
- train: 训练集,包含675个样本,总大小为1180904778.0字节。
数据集大小
- 下载大小: 392613248字节
- 数据集总大小: 1180904778.0字节
配置
- default: 默认配置,包含训练集数据文件路径为
data/train-*。



