sanchit-gandhi/common_voice_16_1_hi_pseudo_labelled

Name: sanchit-gandhi/common_voice_16_1_hi_pseudo_labelled
Creator: sanchit-gandhi
Published: 2024-03-27 16:26:20
License: 暂无描述

Hugging Face2024-03-27 更新2024-06-11 收录

下载链接：

https://hf-mirror.com/datasets/sanchit-gandhi/common_voice_16_1_hi_pseudo_labelled

下载链接

链接失效反馈

官方服务：

资源简介：

这是Common Voice 16.1 Hindi数据集，使用Whisper large-v3模型进行伪标注。数据集包含音频文件及其对应的句子、Whisper转录文本等特征，并分为训练集、验证集和测试集。具体操作步骤可以参考Distil-Whisper仓库的说明。

提供机构：

sanchit-gandhi

原始信息汇总

数据集概述

5,000+

优质数据集

54 个

任务类型

进入经典数据集