ai2_arc

Hugging Face2024-08-05 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/Sadanto3933/ai2_arc

下载链接

链接失效反馈

官方服务：

资源简介：

Ai2Arc数据集包含两个配置：ARC-Challenge和ARC-Easy。这两个配置都用于问题回答任务，具体为开放领域问答和多项选择问答。数据集中的每个实例包含一个ID、一个问题、多个选择项和一个答案键。数据集的语言为英语，许可证为cc-by-sa-4.0。数据集的大小在1K到10K之间。

创建时间：

2024-07-22

原始信息汇总

数据集概述

基本信息

数据集名称: Ai2Arc
语言: 英语
许可证: CC BY-SA 4.0
多语言性: 单语种
数据集大小: 1K<n<10K
源数据集: 原始数据集
任务类别: 问答
任务ID: 开放域问答, 多选问答

数据集配置

ARC-Challenge

特征:
- id: 字符串
- question: 字符串
- choices: 字典，包含
  - text: 字符串
  - label: 字符串
- answerKey: 字符串
分割:
- train: 349760 字节, 1119 样本
- test: 375511 字节, 1172 样本
- validation: 96660 字节, 299 样本
下载大小: 449460 字节
数据集大小: 821931 字节

ARC-Easy

特征:
- id: 字符串
- question: 字符串
- choices: 字典，包含
  - text: 字符串
  - label: 字符串
- answerKey: 字符串
分割:
- train: 619000 字节, 2251 样本
- test: 657514 字节, 2376 样本
- validation: 157394 字节, 570 样本
下载大小: 762935 字节
数据集大小: 1433908 字节

数据实例

ARC-Challenge

训练样本示例: json { "answerKey": "B", "choices": { "label": ["A", "B", "C", "D"], "text": ["Shady areas increased.", "Food sources increased.", "Oxygen levels increased.", "Available water increased."] }, "id": "Mercury_SC_405487", "question": "One year, the oak trees in a park began producing more acorns than usual. The next year, the population of chipmunks in the park also increased. Which best explains why there were more chipmunks the next year?" }

ARC-Easy

训练样本示例: json { "answerKey": "B", "choices": { "label": ["A", "B", "C", "D"], "text": ["Shady areas increased.", "Food sources increased.", "Oxygen levels increased.", "Available water increased."] }, "id": "Mercury_SC_405487", "question": "One year, the oak trees in a park began producing more acorns than usual. The next year, the population of chipmunks in the park also increased. Which best explains why there were more chipmunks the next year?" }

搜集汇总

数据集介绍

构建方式

ai2_arc数据集由Allen Institute for AI开发，旨在评估机器在复杂推理任务中的表现。该数据集通过收集科学考试中的多项选择题构建而成，涵盖了广泛的科学知识领域。数据集的构建过程严格遵循科学考试的标准，确保问题的多样性和难度层次。每个问题均包含多个选项，并标注了正确答案，以便于模型的训练和评估。

特点

ai2_arc数据集以其高难度和多样性著称，分为ARC-Challenge和ARC-Easy两个子集。ARC-Challenge包含更具挑战性的问题，旨在测试模型的高级推理能力；而ARC-Easy则提供相对简单的问题，适合初学者使用。数据集中的每个问题均包含详细的选项和正确答案，便于模型进行多轮训练和验证。此外，数据集的规模适中，既保证了数据的丰富性，又避免了过大的计算负担。

使用方法

使用ai2_arc数据集时，可通过Hugging Face的`datasets`库轻松加载。用户可以选择加载ARC-Challenge或ARC-Easy子集，并根据需要选择训练、验证或测试集。加载后的数据集可直接用于训练和评估问答模型，支持多种任务如开放域问答和多项选择问答。通过该数据集，研究人员能够深入探索模型在复杂推理任务中的表现，并推动问答系统的发展。

背景与挑战

背景概述

AI2 ARC（AI2 Reasoning Challenge）数据集由Allen Institute for Artificial Intelligence（AI2）于2018年发布，旨在推动开放域问答和多项选择问答领域的研究。该数据集的核心研究问题在于评估模型在复杂推理任务中的表现，尤其是在科学知识背景下的推理能力。AI2 ARC的创建团队包括Peter Clark、Isaac Cowhey等知名研究人员，他们通过该数据集挑战现有问答系统的极限，推动了对知识推理和自然语言理解的深入研究。该数据集的影响力不仅体现在其高难度的挑战性问题上，还在于它为学术界提供了一个标准化的基准，促进了问答系统领域的创新与发展。

当前挑战

AI2 ARC数据集的主要挑战在于其高难度的推理任务，尤其是ARC-Challenge子集，要求模型具备深层次的科学知识理解和逻辑推理能力。与传统的问答数据集不同，ARC的问题往往需要跨领域的知识整合和复杂的推理过程，这对现有模型的泛化能力提出了严峻考验。此外，数据集的构建过程中也面临了诸多挑战，包括如何确保问题的多样性和复杂性，以及如何从大量科学文献中提取高质量的问题和答案。这些挑战不仅推动了问答系统技术的进步，也为未来的研究提供了新的方向。

常用场景

经典使用场景

AI2 ARC数据集广泛应用于自然语言处理领域，特别是在开放域问答和多选题问答任务中。该数据集通过提供一系列复杂的科学问题，挑战模型在理解和推理方面的能力。研究人员通常利用该数据集来评估和提升模型在处理复杂逻辑和知识推理任务中的表现。

实际应用

在实际应用中，AI2 ARC数据集被广泛用于教育和智能助手的开发。通过训练模型在该数据集上的表现，可以提升智能助手在回答复杂科学问题时的准确性和可靠性。此外，该数据集还被用于开发教育软件，帮助学生更好地理解和掌握科学知识。

衍生相关工作

AI2 ARC数据集衍生了许多经典的研究工作，特别是在问答系统和知识推理领域。例如，基于该数据集的研究推动了BERT、GPT等预训练模型在复杂问答任务中的应用。此外，许多研究团队利用该数据集开发了新的推理算法和模型架构，进一步提升了问答系统的性能。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集