five

YALD_v0_raw

收藏
Hugging Face2026-03-16 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/ptrdvn/YALD_v0_raw
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多种语言的音频文件、片段、关键词和搜索结果,涵盖孟加拉语(ban)、威尔士语(cym)、爱尔兰语(gle)、维吾尔语(uig)和科萨语(xho)。音频数据集包含id和音频特征,每个语言的音频数据量从1406到13513个样本不等。片段数据集包含丰富的元数据,如时间戳、多种版本的转录文本、视频详情和频道信息。关键词数据集包含关键词和对应的语言名称。搜索结果数据集与片段数据集类似,但增加了与搜索相关的元数据。所有数据集都分为训练集,并提供了详细的下载大小和数据集大小信息。
创建时间:
2026-03-13
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作