spygaurad/ai4bharat_youtube_nepali_pseudo
收藏Hugging Face2024-02-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/spygaurad/ai4bharat_youtube_nepali_pseudo
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频和文本数据,音频的采样率为16000,同时包含文本、Whisper转录和句子信息。数据集分为训练集,共有52519个样本,总大小为16881669418.388字节,下载大小为16268070871字节。数据集的默认配置中,数据文件路径为data/train-*。
该数据集包含音频和文本数据,音频的采样率为16000,同时包含文本、Whisper转录和句子信息。数据集分为训练集,共有52519个样本,总大小为16881669418.388字节,下载大小为16268070871字节。数据集的默认配置中,数据文件路径为data/train-*。
提供机构:
spygaurad
原始信息汇总
数据集概述
数据特征
- 音频
- 采样率: 16000 Hz
- 文本
- 数据类型: 字符串
- whisper_transcript
- 数据类型: 整数序列 (int64)
- 句子
- 数据类型: 字符串
数据分割
- 训练集
- 字节数: 16881669418.388 字节
- 样本数: 52519 个样本
数据集大小
- 下载大小: 16268070871 字节
- 实际大小: 16881669418.388 字节
配置
- 默认配置
- 数据文件路径:
data/train-*
- 数据文件路径:



