irish-augmented-iter1
收藏Hugging Face2026-03-19 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/Eimhin03/irish-augmented-iter1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含7,891条训练样本和965条验证样本的音频转录对,音频采样率为16kHz。数据以标准化的结构化格式存储,包含两个特征字段:'audio'(音频数据)和'transcription'(文本转录)。训练集总大小约6.73GB,验证集约781MB,整体数据集下载大小约7.51GB。文件按train/validation分片存储,路径模式分别为data/train-*和data/validation-*。适用于语音识别、音频转文本等任务。
创建时间:
2026-03-12



