AIR-Bench/qa_wiki_ar
收藏Hugging Face2024-09-28 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/AIR-Bench/qa_wiki_ar
下载链接
链接失效反馈官方服务:
资源简介:
该数据集为阿拉伯语单语种数据集,主要用于文本检索任务中的文档检索。数据集配置名为AIR-Bench_24.05,包含三个数据文件:corpus_default、queries_default_dev和queries_default_test。数据集的任务为问答,领域为维基,语言为阿拉伯语,可用数据集为default,包含开发集和测试集。
This is a monolingual Arabic dataset used for text retrieval tasks. The dataset includes a configuration named AIR-Bench_24.05, which contains splits for the corpus and query data. The domain of the dataset is question answering (qa), sourced from Wikipedia (wiki), and the language is Arabic (ar).
提供机构:
AIR-Bench
搜集汇总
数据集介绍

背景与挑战
背景概述
AIR-Bench/qa_wiki_ar是一个阿拉伯语文本检索数据集,属于AIR-Bench基准测试的一部分,专门用于文档检索任务。该数据集基于维基百科内容构建,包含约101万行数据,格式为JSON,适用于信息检索系统的训练和评估。
以上内容由遇见数据集搜集并总结生成



