SEACrowd/belebele
收藏Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/SEACrowd/belebele
下载链接
链接失效反馈官方服务:
资源简介:
Belebele是一个多选机器阅读理解(MRC)数据集,涵盖122种语言变体。该数据集旨在评估单语和多语模型在高、中、低资源语言中的表现。每个问题有四个多选答案,并与FLORES-200数据集中的短段落相关联。数据集通过精心策划的人工注释程序创建,确保问题能够区分不同层次的通用语言理解能力,并通过广泛的质量检查进行强化。数据集完全并行,支持直接比较模型在所有语言中的表现。
Belebele是一个多选机器阅读理解(MRC)数据集,涵盖122种语言变体。该数据集旨在评估单语和多语模型在高、中、低资源语言中的表现。每个问题有四个多选答案,并与FLORES-200数据集中的短段落相关联。数据集通过精心策划的人工注释程序创建,确保问题能够区分不同层次的通用语言理解能力,并通过广泛的质量检查进行强化。数据集完全并行,支持直接比较模型在所有语言中的表现。
提供机构:
SEACrowd



