tasksource/Boardgame-QA

Name: tasksource/Boardgame-QA
Creator: tasksource
Published: 2023-06-14 07:38:39
License: 暂无描述

Hugging Face2023-06-14 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/tasksource/Boardgame-QA

下载链接

链接失效反馈

官方服务：

资源简介：

--- license: cc-by-4.0 dataset_info: features: - name: proof dtype: string - name: example dtype: string - name: label dtype: string - name: rules dtype: string - name: preferences dtype: string - name: theory dtype: string - name: goal dtype: string - name: facts dtype: string - name: config dtype: string splits: - name: test num_bytes: 54209160 num_examples: 15000 - name: train num_bytes: 55055604 num_examples: 15000 - name: valid num_bytes: 27317650 num_examples: 7500 download_size: 34032485 dataset_size: 136582414 --- https://arxiv.org/pdf/2306.07934.pdf

许可证：CC BY 4.0 数据集信息：特征： - 名称：证明（proof），数据类型：字符串 - 名称：示例（example），数据类型：字符串 - 名称：标签（label），数据类型：字符串 - 名称：规则（rules），数据类型：字符串 - 名称：偏好（preferences），数据类型：字符串 - 名称：理论（theory），数据类型：字符串 - 名称：目标（goal），数据类型：字符串 - 名称：事实（facts），数据类型：字符串 - 名称：配置（config），数据类型：字符串数据集划分： - 划分名称：测试集（test），字节大小：54209160，样本数量：15000 - 划分名称：训练集（train），字节大小：55055604，样本数量：15000 - 划分名称：验证集（valid），字节大小：27317650，样本数量：7500 下载大小：34032485 字节数据集总大小：136582414 字节相关论文链接：https://arxiv.org/pdf/2306.07934.pdf

提供机构：

tasksource

原始信息汇总

数据集概述

数据集特征

proof: 数据类型为字符串
example: 数据类型为字符串
label: 数据类型为字符串
rules: 数据类型为字符串
preferences: 数据类型为字符串
theory: 数据类型为字符串
goal: 数据类型为字符串
facts: 数据类型为字符串
config: 数据类型为字符串

数据集划分

test: 包含15000个样本，总大小为54209160字节
train: 包含15000个样本，总大小为55055604字节
valid: 包含7500个样本，总大小为27317650字节

数据集大小

下载大小: 34032485字节
数据集总大小: 136582414字节

许可证

本数据集遵循CC-BY-4.0许可证

搜集汇总

数据集介绍

构建方式

在人工智能推理领域，Boardgame-QA数据集通过精心设计的结构化流程构建而成。该数据集基于一系列逻辑推理任务，围绕棋盘游戏规则展开，每个样本均包含理论、规则、事实、目标及偏好等核心要素。构建过程中，研究人员采用形式化方法将游戏机制转化为可计算的逻辑表达式，确保数据在语义上的一致性与完整性。数据集的生成依赖于自动化脚本与人工校验相结合的方式，既保证了规模效率，又维护了逻辑严谨性，最终形成包含训练、验证与测试三个分区的标准化语料库。

使用方法

使用Boardgame-QA数据集时，研究者可将其应用于逻辑推理与规则遵循模型的训练与评估。典型流程包括加载数据集的训练、验证与测试分区，并依据任务需求提取相关字段，如规则、事实与目标，构建输入输出对。模型需基于给定的理论背景与约束条件，推导出符合逻辑的证明或决策路径。该数据集支持端到端的监督学习，亦可用于少样本或零样本推理场景的基准测试，为评估模型在结构化环境中的泛化与推理能力提供可靠依据。

背景与挑战

背景概述

Boardgame-QA数据集由tasksource团队于2023年构建，旨在推动复杂推理与逻辑规划领域的研究。该数据集聚焦于棋盘游戏场景，通过整合规则、事实、偏好与目标等多模态信息，为人工智能系统提供了结构化的问题求解环境。其核心研究问题在于如何使模型能够理解并执行基于逻辑推理的决策过程，从而在动态环境中实现目标导向的行为。这一工作不仅丰富了推理数据集的多样性，也为自动规划与知识表示领域注入了新的活力，促进了智能体在复杂任务中表现能力的提升。

当前挑战

Boardgame-QA数据集所针对的领域挑战在于解决复杂逻辑推理与多步骤规划问题，这要求模型能够整合分散的规则与事实，并在动态环境中进行连贯决策。构建过程中的挑战主要体现在数据合成与标注的复杂性上，需要确保规则逻辑的一致性与问题实例的多样性，同时避免引入偏差或矛盾。此外，如何平衡理论表达与实际示例之间的对应关系，以及维持不同游戏配置间的可比性，也是数据集构建中需克服的关键难点。

常用场景

经典使用场景

在人工智能推理领域，Boardgame-QA数据集以其结构化规则与逻辑推理的融合，成为评估模型复杂决策能力的经典工具。该数据集模拟棋盘游戏环境，要求模型依据规则、事实与偏好进行多步推理，以生成证明或达成目标，从而检验模型在受限但丰富的逻辑空间中的演绎与归纳能力。这种场景不仅挑战模型对结构化知识的理解，更推动其在动态交互中实现精准的逻辑链构建，为推理研究提供了标准化的测试平台。

解决学术问题

Boardgame-QA数据集致力于解决人工智能中符号推理与常识整合的学术难题。传统模型往往在抽象逻辑规则与具体情境结合时表现薄弱，该数据集通过引入规则、理论与事实的层次化结构，促使模型学习如何将形式化约束应用于实际决策过程。其意义在于弥合了纯符号系统与数据驱动方法之间的鸿沟，为可解释推理、知识表示与迁移学习提供了实证基础，推动了神经符号推理领域的前沿探索。

实际应用

在实际应用层面，Boardgame-QA数据集为智能教育系统、游戏AI与自动化决策工具的开发提供了关键支撑。例如，在自适应学习平台中，模型可借助该数据集的推理框架设计个性化教学路径；在复杂策略游戏中，AI代理能通过模拟规则与偏好优化行动序列。这些应用不仅提升了系统的交互智能与可解释性，还为医疗诊断、法律分析等需要严谨逻辑推导的领域提供了技术原型。

数据集最近研究