XQuAD 跨语言问答数据集
收藏超神经2023-12-25 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/28458
下载链接
链接失效反馈官方服务:
资源简介:
XQuAD(跨语言问答数据集)是一个用于评估跨语言问答性能的基准数据集。该数据集由 SQuAD v1.1(Rajpurkar 等,2016)开发集中的 240 段落和 1,190 个问题-答案对的子集组成,它们被翻译成了十种语言的专业译文:西班牙语、德语、希腊语、俄语、土耳其语、阿拉伯语、越南语、泰语、中文和印地语。因此,该数据集在 11 种语言之间可以完全平行使用。
XQuAD (Cross-lingual Question Answering Dataset) is a benchmark dataset for evaluating cross-lingual question answering performance. This dataset consists of a subset of 240 paragraphs and 1,190 question-answer pairs from the development set of SQuAD v1.1 (Rajpurkar et al., 2016), which have been professionally translated into ten languages: Spanish, German, Greek, Russian, Turkish, Arabic, Vietnamese, Thai, Chinese, and Hindi. As such, this dataset is fully parallelizable across 11 languages.
创建时间:
2023-12-25
搜集汇总
数据集介绍

背景与挑战
背景概述
XQuAD是一个用于评估跨语言问答性能的基准数据集,它基于SQuAD v1.1的240个段落和1190个问题-答案对子集,并专业翻译成包括中文在内的十种语言,形成11种语言的平行数据。
以上内容由遇见数据集搜集并总结生成



