five

HebArabNlpProject/ArQ

收藏
Hugging Face2025-04-01 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/HebArabNlpProject/ArQ
下载链接
链接失效反馈
官方服务:
资源简介:
ArQ是一个阿拉伯语问答数据集,包含32,625个三元组(上下文-问题-答案),涵盖Levantine口语阿拉伯语和现代标准阿拉伯语(MSA)。数据集的构建遵循了HeQ数据集的方法论,标注团队根据随机提供的段落编写相关问题并标记正确答案。段落来源包括在线以色列阿拉伯语周报的短新闻文章和Levantine阿拉伯语的短视频及采访录音。问题分为可回答和不可回答两类,并进行了质量控制和额外处理。数据集统计信息包括问题类型、子集分布、唯一问题和段落数量以及问题词分布。

ArQ是一个阿拉伯语问答数据集,包含32,625个三元组(上下文-问题-答案),涵盖Levantine口语阿拉伯语和现代标准阿拉伯语(MSA)。数据集的构建遵循了HeQ数据集的方法论,标注团队根据随机提供的段落编写相关问题并标记正确答案。段落来源包括在线以色列阿拉伯语周报的短新闻文章和Levantine阿拉伯语的短视频及采访录音。问题分为可回答和不可回答两类,并进行了质量控制和额外处理。数据集统计信息包括问题类型、子集分布、唯一问题和段落数量以及问题词分布。
提供机构:
HebArabNlpProject
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作