maxseats/aihub-464-preprocessed-680GB-set-0

Name: maxseats/aihub-464-preprocessed-680GB-set-0
Creator: maxseats
Published: 2024-06-13 09:55:49
License: 暂无描述

Hugging Face2024-06-13 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/maxseats/aihub-464-preprocessed-680GB-set-0

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含音频、转录文本、输入特征和标签等特征。音频特征的采样率为16000Hz，转录文本为字符串类型，输入特征为浮点数序列，标签为整数序列。数据集分为训练、测试和验证三个部分，每个部分包含不同数量的样本和字节数。数据集的创建过程涉及音频和字幕文件的处理，以及将处理后的数据转换为适合训练的格式。

提供机构：

maxseats

原始信息汇总

数据集概述

config_name: default
- data_files:
  - train: data/train-*
  - test: data/test-*
  - valid: data/valid-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集