rikeshsilwalekg/43-143-phase2-appconv-ime-large-v3-prepared
收藏Hugging Face2024-07-19 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/rikeshsilwalekg/43-143-phase2-appconv-ime-large-v3-prepared
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频和文本数据,具体特征包括音频文件、句子文本、文件路径、输入长度、输入特征序列、标签序列和标签长度。数据集分为训练集,包含11425个样本,总大小为18843232020.0字节。下载大小为3797183803字节。
This dataset contains audio and text data, with specific features including audio files, sentence text, file paths, input length, input feature sequences, label sequences, and label length. The dataset is divided into a training set, containing 11425 samples, with a total size of 18843232020.0 bytes. The download size is 3797183803 bytes.
提供机构:
rikeshsilwalekg
原始信息汇总
数据集概述
数据集信息
特征
- audio: 音频数据,采样率为16000。
- sentence: 文本数据,数据类型为字符串。
- path: 路径信息,数据类型为字符串。
- input_length: 输入长度,数据类型为int64。
- input_features: 输入特征,序列类型为float32。
- labels: 标签,序列类型为int64。
- labels_length: 标签长度,数据类型为int64。
数据分割
- train: 训练集,包含11425个样本,总大小为18843232020.0字节。
数据集大小
- 下载大小: 3797183803字节
- 数据集总大小: 18843232020.0字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



