alvanlii/cantonese-youtube-transcription-diarized-max-filtered

Name: alvanlii/cantonese-youtube-transcription-diarized-max-filtered
Creator: alvanlii
Published: 2024-06-17 10:26:07
License: 暂无描述

Hugging Face2024-06-17 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/alvanlii/cantonese-youtube-transcription-diarized-max-filtered

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含音频数据及其相关标签、频道和标题信息。音频数据的采样率为16000Hz，且不进行解码处理。数据集主要包含一个训练分割，共有1,490,591个示例，总大小为533,055,361,985.981字节。

This dataset includes audio data along with associated labels, channels, and titles. The audio data has a sampling rate of 16000Hz and is not decoded. The dataset primarily consists of a training split with 1,490,591 examples, totaling 533,055,361,985.981 bytes.

提供机构：

alvanlii

5,000+

优质数据集

54 个

任务类型

进入经典数据集