QoG

Hugging Face2025-05-07 更新2025-05-08 收录

下载链接：

https://huggingface.co/datasets/lianglz/QoG

下载链接

链接失效反馈

官方服务：

资源简介：

Question-on-Graph (QoG)是一个用于复杂多跳问题回答的基准数据集，它针对公共知识图谱构建。该数据集使用GPT-4.1生成高质量的自然语言问题，这些问题基于从Wikidata提取的子图。每个数据实例包括一个种子实体、一个连接的RDF子图证明、一个多跳问题、一个SPARQL查询以及对应的答案集。

Question-on-Graph (QoG) is a benchmark dataset for complex multi-hop question answering, constructed over public knowledge graphs. This dataset uses GPT-4.1 to generate high-quality natural language questions grounded in subgraphs extracted from Wikidata. Each data instance includes a seed entity, a connected RDF subgraph proof, a multi-hop question, a SPARQL query, and the corresponding answer set.

创建时间：

2025-05-06

原始信息汇总

数据集概述

基本信息

数据集名称: Question-on-Graph (QoG)
任务类别: 问答（question-answering）
标签: 代码、生物学、化学、金融、音乐、艺术、医学、气候、法律
规模: 10K<n<100K

数据集内容

特征:
- id (int64)
- seed (string)
- question (string)
- answer (sequence of strings)
- sparql (string)
- proof (sequence of sequence of strings)
数据量:
- 总大小: 19,006,119字节
- 下载大小: 7,847,597字节

数据划分

full:
- 样本数: 10,787
- 大小: 9,505,023字节
train:
- 样本数: 8,629
- 大小: 7,603,058字节
dev:
- 样本数: 1,079
- 大小: 940,878字节
test:
- 样本数: 1,079
- 大小: 957,160字节

数据集描述

Question-on-Graph (QoG) 是一个用于复杂多跳问答的基准数据集，基于公共知识图谱构建。数据集使用GPT-4.1生成高质量的自然语言问题，这些问题基于从Wikidata提取的子图。每个实例包括一个种子实体、一个连接的RDF子图证明、一个多跳问题、一个SPARQL查询和相应的答案集。

搜集汇总

数据集介绍

构建方式

在知识图谱推理领域，QoG数据集采用前沿的生成式方法构建，通过GPT-4.1模型从Wikidata知识库中提取子图结构作为语义基础。研究团队设计了严谨的生成流程：首先选定种子实体，自动构建关联的RDF子图作为逻辑证明框架，继而生成具有多跳推理特性的自然语言问题，并配套生成标准SPARQL查询语句及正确答案集合。这种基于大语言模型与结构化知识库协同的构建范式，确保了数据在逻辑复杂性和语义准确性上的双重优势。

特点

作为跨领域复杂问答基准，QoG数据集最显著的特征是其多模态知识覆盖，涵盖编程、生物、化学等九大专业领域。数据集包含10,787个高质量样本，每个样本构成完整的推理链条：从种子实体出发，通过结构化子图证明过程，最终抵达多跳问题的答案。独特的SPARQL查询标注为知识图谱推理任务提供了可解释性研究基础，而严格划分的训练集（8,629例）、验证集（1,079例）和测试集（1,079例）则满足模型开发的评估需求。

使用方法

该数据集适用于知识图谱多跳推理任务的端到端评估，研究者可通过加载标准分割方案快速构建实验环境。典型使用场景包括：基于问题文本和SPARQL查询的联合建模、子图证明路径的可视化分析、或答案生成模型的微调训练。数据集中提供的结构化证明链条支持可解释性研究，开发者可依据seed字段追溯原始知识子图，结合proof字段验证模型推理过程的合理性。对于跨领域迁移学习，建议优先关注生物学、法律等专业性较强的子集。

背景与挑战

背景概述

Question-on-Graph (QoG) 数据集是面向公共知识图谱复杂多跳问答任务的基准数据集，由GPT-4.1模型参与构建，旨在推动知识图谱推理领域的研究进展。该数据集基于Wikidata抽取的子图结构，通过生成高质量的自然语言问题，为多跳推理提供了丰富的语义关联场景。每个数据实例包含种子实体、关联的RDF子图证明、多跳问题、SPARQL查询及对应答案集合，其跨学科特性覆盖了代码、生物、化学等九大领域，为评估模型在复杂知识推理中的表现提供了标准化测试平台。

当前挑战

QoG数据集面临的核心挑战主要体现在两个方面：在领域问题层面，多跳问答要求模型具备跨实体关系的深层推理能力，如何准确解析问题语义并定位分散的知识片段构成显著难点；在构建过程中，确保生成问题的逻辑连贯性与答案可验证性需依赖严格的子图筛选机制，同时平衡各学科领域的数据分布亦增加了数据集的构建复杂度。此外，SPARQL查询与自然语言问题间的对齐精度，以及对抗生成问题中的语义偏差，均为数据集质量控制的潜在挑战。

常用场景

经典使用场景

在知识图谱推理领域，QoG数据集因其多跳问答特性成为评估复杂推理能力的黄金标准。研究者利用其丰富的SPARQL查询和结构化证明链，训练模型在生物、化学、金融等跨领域知识图谱中进行深度语义关联，特别适合验证模型处理长程依赖和逻辑组合的能力。数据集通过GPT-4.1生成的高质量自然语言问题，完美模拟了真实场景中人类进行知识检索的复杂认知过程。

衍生相关工作

基于QoG衍生的经典工作包括知识图谱嵌入与语言模型融合架构KG-BERT，其通过联合训练SPARQL解析器与问答模块实现端到端推理。后续研究如MetaQA 2.0进一步扩展了多模态推理维度，而GNN-QA则创新性地将图神经网络应用于子图证明生成，这些突破性工作共同推动了解释性AI的发展进程。

数据集最近研究