XCOPA
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/XCOPA
下载链接
链接失效反馈官方服务:
资源简介:
合理替代方案的跨语言选择 (XCOPA) 数据集是评估机器学习模型跨语言转移常识推理能力的基准。该数据集是英语 COPA (Roemmele et al. 2011) 的翻译和再注释,涵盖了来自 11 个家庭和全球多个地区的 11 种语言。该数据集具有挑战性,因为它既需要掌握世界知识,又需要泛化到新语言的能力。
The Cross-lingual Choice of Plausible Alternatives (XCOPA) dataset is a benchmark for evaluating machine learning models’ capabilities in cross-lingual transfer of commonsense reasoning. This dataset is a translated and re-annotated iteration of the English COPA (Roemmele et al. 2011), encompassing 11 languages from 11 linguistic families across various global regions. The dataset presents significant challenges, as it necessitates both proficiency in world knowledge and the capacity to generalize to previously unseen languages.
提供机构:
OpenDataLab
创建时间:
2022-06-28
搜集汇总
数据集介绍

背景与挑战
背景概述
XCOPA是一个多语言常识推理数据集,涵盖11种语言,用于评估模型的跨语言迁移能力。该数据集由剑桥大学和曼海姆大学于2020年发布,基于英语COPA数据集构建,具有挑战性,要求模型具备世界知识和语言泛化能力。
以上内容由遇见数据集搜集并总结生成



