Subhadeep/English_IITM_Check_dataset_en_pseudo_labelled
收藏Hugging Face2023-11-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Subhadeep/English_IITM_Check_dataset_en_pseudo_labelled
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频数据及其相关信息,如路径、句子、长度和Whisper转录。数据集配置为英文,包含一个训练分割,共有3009个样本,总大小为618348530.525字节。
该数据集包含音频数据及其相关信息,如路径、句子、长度和Whisper转录。数据集配置为英文,包含一个训练分割,共有3009个样本,总大小为618348530.525字节。
提供机构:
Subhadeep
原始信息汇总
数据集概述
配置信息
- 配置名称: en
特征信息
- 音频:
- 采样率: 16000
- 路径: 字符串类型
- 句子: 字符串类型
- 长度: 浮点数类型
- whisper转录: 整数序列类型
数据分割
- 训练集:
- 字节数: 618348530.525
- 样本数: 3009
数据大小
- 下载大小: 606619139
- 数据集大小: 618348530.525
配置详情
- 配置名称: en
- 数据文件:
- 分割: 训练集
- 路径: en/train-*



