five

SEACrowd/belebele

收藏
Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/SEACrowd/belebele
下载链接
链接失效反馈
官方服务:
资源简介:
Belebele是一个多选机器阅读理解(MRC)数据集,涵盖122种语言变体。该数据集旨在评估单语和多语模型在高、中、低资源语言中的表现。每个问题有四个多选答案,并与FLORES-200数据集中的短段落相关联。数据集通过精心策划的人工注释程序创建,确保问题能够区分不同层次的通用语言理解能力,并通过广泛的质量检查进行强化。数据集完全并行,支持直接比较模型在所有语言中的表现。

Belebele是一个多选机器阅读理解(MRC)数据集,涵盖122种语言变体。该数据集旨在评估单语和多语模型在高、中、低资源语言中的表现。每个问题有四个多选答案,并与FLORES-200数据集中的短段落相关联。数据集通过精心策划的人工注释程序创建,确保问题能够区分不同层次的通用语言理解能力,并通过广泛的质量检查进行强化。数据集完全并行,支持直接比较模型在所有语言中的表现。
提供机构:
SEACrowd
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作