HebArabNlpProject/ArQ
收藏Hugging Face2025-04-01 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/HebArabNlpProject/ArQ
下载链接
链接失效反馈官方服务:
资源简介:
ArQ是一个阿拉伯语问答数据集,包含32,625个三元组(上下文-问题-答案),涵盖Levantine口语阿拉伯语和现代标准阿拉伯语(MSA)。数据集的构建遵循了HeQ数据集的方法论,标注团队根据随机提供的段落编写相关问题并标记正确答案。段落来源包括在线以色列阿拉伯语周报的短新闻文章和Levantine阿拉伯语的短视频及采访录音。问题分为可回答和不可回答两类,并进行了质量控制和额外处理。数据集统计信息包括问题类型、子集分布、唯一问题和段落数量以及问题词分布。
ArQ是一个阿拉伯语问答数据集,包含32,625个三元组(上下文-问题-答案),涵盖Levantine口语阿拉伯语和现代标准阿拉伯语(MSA)。数据集的构建遵循了HeQ数据集的方法论,标注团队根据随机提供的段落编写相关问题并标记正确答案。段落来源包括在线以色列阿拉伯语周报的短新闻文章和Levantine阿拉伯语的短视频及采访录音。问题分为可回答和不可回答两类,并进行了质量控制和额外处理。数据集统计信息包括问题类型、子集分布、唯一问题和段落数量以及问题词分布。
提供机构:
HebArabNlpProject



