awajai/phase2-stt-slr143

Name: awajai/phase2-stt-slr143
Creator: awajai
Published: 2024-07-14 11:14:51
License: 暂无描述

Hugging Face2024-07-14 更新2024-07-22 收录

下载链接：

https://hf-mirror.com/datasets/awajai/phase2-stt-slr143

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含音频、句子、路径、输入长度、输入特征、标签和标签长度等特征。数据集分为训练集，包含675个样本，总大小为1180904778字节。下载大小为392613248字节。配置文件指定了数据文件的路径。

This dataset is primarily used for speech recognition tasks, containing audio, text, and related metadata. The audio features have a sampling rate of 16000 Hz, suitable for high-precision speech processing. The dataset structure includes a training set with 675 samples, each containing audio, corresponding sentence, file path, input length, input features, labels, and labels length. The download size of the dataset is 392613248 bytes, and the total size is 1180904778 bytes.

提供机构：

awajai

原始信息汇总

数据集概述

数据集特征

audio: 音频数据，采样率为16000。
sentence: 字符串类型，表示句子。
path: 字符串类型，表示路径。
input_length: 整数类型，表示输入长度。
input_features: 序列类型，包含浮点数。
labels: 序列类型，包含整数。
labels_length: 整数类型，表示标签长度。

数据集分割

train: 训练集，包含675个样本，总大小为1180904778.0字节。

数据集大小

下载大小: 392613248字节
数据集总大小: 1180904778.0字节

配置

default: 默认配置，包含训练集数据文件路径为data/train-*。

5,000+

优质数据集

54 个

任务类型

进入经典数据集