five

surindersinghssj/gurbani-kirtan-vad-test

收藏
Hugging Face2026-04-08 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/surindersinghssj/gurbani-kirtan-vad-test
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: audio_original dtype: audio: sampling_rate: 16000 - name: audio_trimmed dtype: audio: sampling_rate: 16000 - name: video_id dtype: string - name: gurmukhi_ocr dtype: string - name: gurmukhi_text dtype: string - name: english_translation dtype: string - name: shabad_title dtype: string - name: duration_original dtype: float32 - name: duration_trimmed dtype: float32 - name: voice_ratio dtype: float32 - name: num_voice_segments dtype: int32 - name: voice_timestamps dtype: string - name: longest_silence dtype: float32 - name: avg_voice_chunk dtype: float32 splits: - name: train num_bytes: 79853222 num_examples: 73 download_size: 79851785 dataset_size: 79853222 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息: 特征列表: - 字段名:原始音频(audio_original),数据类型:音频,采样率:16000Hz - 字段名:裁剪后音频(audio_trimmed),数据类型:音频,采样率:16000Hz - 字段名:视频ID(video_id),数据类型:字符串 - 字段名:果鲁穆奇语OCR结果(gurmukhi_ocr),数据类型:字符串 - 字段名:果鲁穆奇语文本(gurmukhi_text),数据类型:字符串 - 字段名:英文译文(english_translation),数据类型:字符串 - 字段名:沙巴德标题(shabad_title),数据类型:字符串 - 字段名:原始音频时长(duration_original),数据类型:32位浮点型 - 字段名:裁剪后音频时长(duration_trimmed),数据类型:32位浮点型 - 字段名:语音占比(voice_ratio),数据类型:32位浮点型 - 字段名:语音片段数量(num_voice_segments),数据类型:32位整型 - 字段名:语音时间戳(voice_timestamps),数据类型:字符串 - 字段名:最长静默时长(longest_silence),数据类型:32位浮点型 - 字段名:平均语音块时长(avg_voice_chunk),数据类型:32位浮点型 数据集划分: - 划分名称:训练集(train),占用字节数:79853222,样本数量:73 下载大小:79851785 数据集总大小:79853222 配置项: - 配置名称:默认配置(default),数据文件: - 对应划分:训练集(train),数据路径:data/train-*
提供机构:
surindersinghssj
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作