five

AIR-Bench/qa_wiki_ar

收藏
Hugging Face2024-09-28 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/AIR-Bench/qa_wiki_ar
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集为阿拉伯语单语种数据集,主要用于文本检索任务中的文档检索。数据集配置名为AIR-Bench_24.05,包含三个数据文件:corpus_default、queries_default_dev和queries_default_test。数据集的任务为问答,领域为维基,语言为阿拉伯语,可用数据集为default,包含开发集和测试集。

This is a monolingual Arabic dataset used for text retrieval tasks. The dataset includes a configuration named AIR-Bench_24.05, which contains splits for the corpus and query data. The domain of the dataset is question answering (qa), sourced from Wikipedia (wiki), and the language is Arabic (ar).
提供机构:
AIR-Bench
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
AIR-Bench/qa_wiki_ar是一个阿拉伯语文本检索数据集,属于AIR-Bench基准测试的一部分,专门用于文档检索任务。该数据集基于维基百科内容构建,包含约101万行数据,格式为JSON,适用于信息检索系统的训练和评估。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作