atmatechdev/dataset_120k_pseudo_labelled_filter

Name: atmatechdev/dataset_120k_pseudo_labelled_filter
Creator: atmatechdev
Published: 2024-06-04 04:44:06
License: 暂无描述

Hugging Face2024-06-04 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/atmatechdev/dataset_120k_pseudo_labelled_filter

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含音频和文本信息，具体特征包括音频（采样率为16000Hz）、句子、路径、条件序列和Whisper转录文本。数据集分为训练集和测试集，训练集包含95808个样本，测试集包含23951个样本。数据集的下载大小为21640531900字节，总大小为21995567460.631466字节。

提供机构：

atmatechdev

原始信息汇总

数据集概述

5,000+

优质数据集

54 个

任务类型

进入经典数据集