GCRC

github2021-12-30 更新2024-05-31 收录

下载链接：

https://github.com/SXUNLP/GCRC

下载链接

链接失效反馈

官方服务：

资源简介：

GCRC是一个新的挑战性MRC数据集，源自高考中文，用于可解释性评估。该数据集包含超过5000个文本和超过8700个多项选择题（约15000个选项），并标注了句子级支持事实、干扰项的错误原因以及回答问题所需的推理技能。相关实验表明，这个数据集更具挑战性，对于诊断系统的局限性非常有用，并将帮助研究人员开发新的机器学习和推理方法来解决这些未来挑战性问题。

GCRC is a novel and challenging Machine Reading Comprehension (MRC) dataset derived from the Chinese College Entrance Examination, designed for interpretability evaluation. This dataset encompasses over 5,000 texts and more than 8,700 multiple-choice questions (approximately 15,000 options), annotated with sentence-level supporting facts, reasons for distractor errors, and the reasoning skills required to answer the questions. Relevant experiments have demonstrated that this dataset is more challenging, highly useful for diagnosing system limitations, and will assist researchers in developing new machine learning and reasoning methods to address these future challenges.

创建时间：

2021-08-18

原始信息汇总

数据集概述

GCRC（高考中文机器阅读理解数据集）是一个包含超过5000篇文本和超过8700个多项选择题的数据集，旨在通过标准化的人类测试有效且实际地评估机器智能。该数据集特别关注高考阅读理解测试，涵盖了过去10年的试题，并提供了三种类型的标注信息：句子级支持事实、干扰项的错误原因以及回答问题所需的推理技能。

数据集特点

数据量：包含超过5000篇文本和8700多个多项选择题。
标注信息：提供句子级支持事实、干扰项的错误原因和推理技能的标注。
应用目标：旨在通过高考阅读理解任务评估机器智能，并诊断系统的推理过程。

数据集用途

GCRC数据集适用于开发和评估机器阅读理解模型，特别是那些需要解释性评估的模型。该数据集的挑战性有助于研究人员诊断系统限制，并开发新的机器学习和推理方法。

作者和机构

作者：Hongye Tan, Xiaoyue Wang, Yu Ji, Ru Li, Xiaoli Li, Zhiwei Hu, Yunxiao Zhao, Xiaoqi Han.
机构：Shanxi University

引用信息

bibtex @inproceedings{tan-etal-2021-gcrc, title = "{GCRC}: A New Challenging {MRC} Dataset from {G}aokao {C}hinese for Explainable Evaluation", author = "Tan, Hongye and Wang, Xiaoyue and Ji, Yu and Li, Ru and Li, Xiaoli and Hu, Zhiwei and Zhao, Yunxiao and Han, Xiaoqi", booktitle = "Findings of the Association for Computational Linguistics: ACL-IJCNLP 2021", month = aug, year = "2021", address = "Online", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/2021.findings-acl.113", doi = "10.18653/v1/2021.findings-acl.113", pages = "1319--1330", }

搜集汇总

数据集介绍

构建方式

GCRC数据集的构建基于中国高考语文阅读理解题目，旨在通过标准化的人类测试来评估机器智能。研究团队收集了过去十年间的高考阅读理解试题，构建了一个包含超过5000篇文本和8700多道选择题（约15000个选项）的数据集。每道题目均标注了句子级别的支持事实、干扰项的错误原因以及解答问题所需的推理技能，从而为模型的可解释性评估提供了坚实基础。

使用方法

GCRC数据集的使用方法主要包括下载数据集、运行评估脚本以及参与公开的排行榜。用户可以通过GitHub或相关平台获取数据集和评估脚本，并根据提供的基线代码进行实验。数据集的设计旨在支持可解释性评估，因此用户可以通过分析模型的推理过程来改进其性能。此外，数据集还提供了详细的标注信息，帮助研究者深入理解模型的决策机制。

背景与挑战

背景概述

GCRC数据集由山西大学的研究团队于2021年构建，旨在通过高考语文阅读理解任务来评估机器的阅读理解能力。该数据集包含了过去十年间的高考阅读理解试题，涵盖了超过5000篇文本和8700多道选择题，共计约15000个选项。GCRC的独特之处在于其标注了句子级别的支持事实、干扰项的错误原因以及解答问题所需的推理技能。这一数据集不仅为机器阅读理解模型提供了更具挑战性的测试环境，还通过可解释的评估方式帮助诊断系统的局限性，推动了机器智能向类人智能的发展。

当前挑战

GCRC数据集面临的挑战主要体现在两个方面。首先，高考阅读理解试题的多样性和复杂性要求模型具备深层次的推理能力，而不仅仅是表面信息的匹配。这使得现有的机器阅读理解模型在应对此类任务时表现不佳，尤其是在处理干扰项和复杂推理问题时。其次，数据集的构建过程中，研究人员需要精确标注句子级别的支持事实和干扰项的错误原因，这一过程不仅耗时且需要高度的专业知识。此外，如何通过可解释的评估方式诊断模型的局限性，并推动新的机器学习与推理方法的发展，也是该数据集面临的重要挑战。

常用场景

经典使用场景

GCRC数据集在机器阅读理解（MRC）领域中被广泛用于评估模型在复杂语言理解任务中的表现。其独特的优势在于基于中国高考语文阅读理解题目，涵盖了多样化的文本类型和复杂的推理问题。研究人员通过该数据集能够深入分析模型在理解长文本、处理干扰项以及进行多步推理时的表现，从而推动模型在解释性评估方面的进步。

解决学术问题

GCRC数据集解决了当前机器阅读理解领域中的两大关键问题：一是现有数据集多为黑箱评估，难以诊断模型的推理过程是否正确；二是现有数据集的难度不足以全面评估模型的真实语言理解能力。通过提供句子级别的支持事实、干扰项错误原因以及问题所需的推理技能等标注信息，GCRC为研究人员提供了更透明、更具挑战性的评估工具，推动了模型在解释性推理方面的发展。

实际应用

GCRC数据集的实际应用场景主要集中在教育科技和自然语言处理领域。在教育科技中，该数据集可用于开发智能辅导系统，帮助学生提升阅读理解能力；在自然语言处理领域，GCRC为开发更智能的问答系统和对话系统提供了高质量的测试基准。此外，其基于高考题目的设计也为教育评估和语言能力测试提供了新的研究方向。

数据集最近研究