YALD_v0_raw
收藏Hugging Face2026-03-16 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/ptrdvn/YALD_v0_raw
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多种语言的音频文件、片段、关键词和搜索结果,涵盖孟加拉语(ban)、威尔士语(cym)、爱尔兰语(gle)、维吾尔语(uig)和科萨语(xho)。音频数据集包含id和音频特征,每个语言的音频数据量从1406到13513个样本不等。片段数据集包含丰富的元数据,如时间戳、多种版本的转录文本、视频详情和频道信息。关键词数据集包含关键词和对应的语言名称。搜索结果数据集与片段数据集类似,但增加了与搜索相关的元数据。所有数据集都分为训练集,并提供了详细的下载大小和数据集大小信息。
创建时间:
2026-03-13



