community-datasets/qa4mre

Name: community-datasets/qa4mre
Creator: community-datasets
Published: 2024-06-26 05:31:09
License: 暂无描述

Hugging Face2024-06-26 更新2024-06-15 收录

下载链接：

https://hf-mirror.com/datasets/community-datasets/qa4mre

下载链接

链接失效反馈

官方服务：

资源简介：

QA4MRE数据集是为CLEF 2011/2012/2013共享任务创建的，旨在促进问答和阅读理解领域的研究。该数据集包含支持性段落和相应的问题，每个问题提供多个选项，其中只有一个正确答案。数据集是多语言的，涵盖阿拉伯语、保加利亚语、德语、英语、西班牙语、意大利语和罗马尼亚语。数据集根据年份和语言分为不同的配置，每个配置包含诸如topic_id、topic_name、test_id、document_id、document_str、question_id、question_str、answer_options、correct_answer_id和correct_answer_str等特征。数据集分为训练集和测试集，并提供了关于阿尔茨海默症数据和入学考试数据的额外黄金标准文档。

The QA4MRE dataset was created for the CLEF 2011/2012/2013 shared tasks, aiming to advance research in the fields of question answering and reading comprehension. This dataset includes supporting passages and corresponding questions, with each question providing multiple options where only one is the correct answer. It is a multilingual dataset covering Arabic, Bulgarian, German, English, Spanish, Italian, and Romanian. The dataset is divided into different configurations based on year and language, and each configuration contains features such as topic_id, topic_name, test_id, document_id, document_str, question_id, question_str, answer_options, correct_answer_id, and correct_answer_str. The dataset is split into training and test sets, and additional gold-standard documents for Alzheimer's disease data and entrance examination data are provided.

提供机构：

community-datasets

原始信息汇总

数据集概述

基本信息

数据集名称: QA4MRE: Question Answering for Machine Reading Evaluation
语言: 阿拉伯语 (ar), 保加利亚语 (bg), 德语 (de), 英语 (en), 西班牙语 (es), 意大利语 (it), 罗马尼亚语 (ro)
多语言性: 多语言
数据集大小: 1K<n<10K
源数据: 原始数据
任务类别: 多项选择
任务ID: 多项选择问答 (multiple-choice-qa)

数据集配置

数据集包含多个配置，每个配置对应不同的年份和语言，具体如下：

2011年

2011.main.DE: 德语
2011.main.EN: 英语
2011.main.ES: 西班牙语
2011.main.IT: 意大利语
2011.main.RO: 罗马尼亚语

2012年

2012.main.AR: 阿拉伯语
2012.main.BG: 保加利亚语
2012.main.DE: 德语
2012.main.EN: 英语
2012.main.ES: 西班牙语
2012.main.IT: 意大利语
2012.main.RO: 罗马尼亚语
2012.alzheimers.EN: 英语（阿尔茨海默病专题）

2013年

2013.main.AR: 阿拉伯语
2013.main.BG: 保加利亚语
2013.main.EN: 英语
2013.main.ES: 西班牙语
2013.main.RO: 罗马尼亚语
2013.alzheimers.EN: 英语（阿尔茨海默病专题）
2013.entrance_exam.EN: 英语（入学考试专题）

数据结构

每个配置包含以下字段：

topic_id: 主题ID
topic_name: 主题名称
test_id: 测试ID
document_id: 文档ID
document_str: 文档内容
question_id: 问题ID
question_str: 问题内容
answer_options: 答案选项，包含：
- answer_id: 答案ID
- answer_str: 答案内容
correct_answer_id: 正确答案ID
correct_answer_str: 正确答案内容

数据分割

每个配置仅包含训练集（train），具体数据量如下：

配置名称	训练集数量
2011.main.DE	120
2011.main.EN	120
2011.main.ES	120
2011.main.IT	120
2011.main.RO	120
2012.main.AR	160
2012.main.BG	160
2012.main.DE	160
2012.main.EN	160
2012.main.ES	160
2012.main.IT	160
2012.main.RO	160
2012.alzheimers.EN	40
2013.main.AR	284
2013.main.BG	284
2013.main.EN	284
2013.main.ES	284
2013.main.RO	284
2013.alzheimers.EN	40
2013.entrance_exam.EN	46

搜集汇总

数据集介绍

构建方式

QA4MRE数据集是为CLEF 2011/2012/2013共享任务而构建的，旨在推动问答系统和阅读理解领域的研究。该数据集通过提供支持性段落和对应的问题集，每个问题包含多个选项，其中仅有一个正确答案。数据集的构建基于原始数据，涵盖了多种语言，包括阿拉伯语、保加利亚语、德语、英语、西班牙语、意大利语和罗马尼亚语。数据集的训练集和测试集分别用于主赛道，同时还提供了针对阿尔茨海默病和入学考试数据的额外金标准文档。

特点

QA4MRE数据集的特点在于其多语言支持和多样化的任务设置。数据集涵盖了多种语言，使得研究者能够在跨语言环境下进行问答系统的评估。每个数据实例包含一个主题ID、主题名称、测试ID、文档ID、文档内容、问题ID、问题内容、答案选项以及正确答案ID和内容。这种结构化的数据格式便于模型的训练和评估，同时也为多任务学习提供了丰富的资源。

使用方法

QA4MRE数据集的使用方法主要包括加载数据集、预处理数据、训练模型和评估模型性能。用户可以通过Hugging Face的`datasets`库轻松加载数据集，并根据需要选择特定的语言配置。在预处理阶段，用户可以对文档和问题进行分词、编码等操作。训练阶段可以使用多种机器学习或深度学习模型进行问答任务的训练。最后，通过评估模型在测试集上的表现，用户可以获得模型的准确率、召回率等指标，从而优化模型性能。

背景与挑战

背景概述

QA4MRE（Question Answering for Machine Reading Evaluation）数据集是为CLEF 2011/2012/2013共享任务而创建的，旨在推动问答系统和阅读理解领域的研究。该数据集由支持性段落和对应的问题组成，每个问题提供多个答案选项，其中仅有一个正确答案。数据集涵盖了多种语言，包括阿拉伯语、保加利亚语、德语、英语、西班牙语、意大利语和罗马尼亚语，展示了其多语言特性。该数据集的创建时间可追溯至2011年，主要研究人员和机构包括CLEF（Conference and Labs of the Evaluation Forum）的相关团队。QA4MRE数据集在机器阅读理解领域具有重要影响力，为模型的多语言理解和推理能力提供了基准测试平台。

当前挑战

QA4MRE数据集的核心挑战在于其多语言和多领域的复杂性。首先，数据集涵盖了多种语言，要求模型具备跨语言的理解能力，这对模型的泛化能力提出了较高要求。其次，数据集中的问题设计复杂，涉及推理、归纳和细节理解等多种认知能力，这对模型的阅读理解能力提出了严峻挑战。此外，数据集的构建过程中也面临诸多困难，例如如何确保不同语言和领域的问题具有一致的质量和难度，以及如何准确标注正确答案。这些挑战使得QA4MRE成为评估和提升机器阅读理解模型性能的重要工具。

常用场景

经典使用场景

QA4MRE数据集广泛应用于机器阅读理解领域，特别是在多语言环境下的问答系统开发中。该数据集通过提供多篇支持性文章及其对应的问题和答案选项，帮助研究者评估和提升模型在阅读理解任务中的表现。其经典使用场景包括训练和测试问答模型，尤其是在多语言环境下的跨语言理解能力。

衍生相关工作

QA4MRE数据集催生了许多经典的研究工作，特别是在多语言问答系统和机器阅读理解领域。基于该数据集的研究成果包括跨语言问答模型的开发、基于深度学习的阅读理解算法优化以及多任务学习框架的设计。这些工作不仅提升了问答系统的性能，还为后续研究提供了丰富的理论基础和实践经验。

数据集最近研究