Spider4SPARQL
收藏arXiv2023-12-08 更新2024-06-21 收录
下载链接:
https://github.com/ckosten/Spider4SPARQL
下载链接
链接失效反馈官方服务:
资源简介:
Spider4SPARQL是由苏黎世应用科技大学创建的一个用于评估知识图谱问答系统的大型跨领域基准数据集。该数据集包含10,181个手动生成的自然语言问题和4,721个独特的复杂SPARQL查询,覆盖138个不同领域。数据集的创建过程涉及将现有的关系数据库和SQL查询转换为知识图谱和SPARQL查询,使用了一种基于本体数据访问的方法来解决原始数据集的数据建模问题。Spider4SPARQL主要用于评估现代知识图谱问答系统的性能,特别是在处理复杂查询和多领域数据时的能力。
Spider4SPARQL is a large-scale cross-domain benchmark dataset developed by Zurich University of Applied Sciences for evaluating knowledge graph question answering systems. It contains 10,181 manually generated natural language questions and 4,721 unique complex SPARQL queries, spanning 138 distinct domains. The dataset construction process involves converting existing relational databases and SQL queries into knowledge graphs and SPARQL queries, utilizing an ontology-based data access approach to resolve data modeling challenges of the original dataset. Spider4SPARQL is primarily employed to assess the performance of modern knowledge graph question answering systems, especially their capabilities in handling complex queries and multi-domain data.
提供机构:
苏黎世应用科技大学
创建时间:
2023-09-28
搜集汇总
数据集介绍

构建方式
在知识图谱问答领域,现有基准数据集常因模式化生成方法而难以泛化至真实场景的复杂查询。Spider4SPARQL的构建基于Spider数据集,通过虚拟知识图谱技术将166个关系数据库自动转换为知识图谱与本体。具体而言,采用基于本体的数据访问方法,将SQLite数据库迁移至PostgreSQL以修正数据建模与类型错误,随后利用直接映射与R2RML标准生成RDF结构。SQL查询则通过中间语言SemQL转换为SPARQL,其中95%的查询可自动翻译,剩余部分经人工校正以确保执行准确性,最终形成包含4,721个独特SPARQL查询的多领域基准。
特点
Spider4SPARQL作为当前最复杂的跨领域知识图谱问答基准,其核心特点在于查询的多样性与真实性。数据集涵盖9,693个人工生成的自然语言问题,避免了模板化方法导致的过拟合问题。SPARQL查询支持多达10个三元组模式、6跳关系以及聚合、集合操作等高级特性,覆盖计数、最小值、最大值、平均值与求和等多种聚合类型。此外,数据集包含166个知识图谱与本体,涉及138个不同领域,如航班、音乐会和餐厅等,确保了广泛的领域覆盖与查询复杂性,为评估系统在真实场景中的泛化能力提供了坚实基础。
使用方法
Spider4SPARQL主要用于评估知识图谱问答系统的性能,尤其适用于测试自然语言到SPARQL的翻译能力。研究人员可将数据集划分为训练集与测试集,利用其提供的自然语言问题、SPARQL查询及对应知识图谱进行模型训练与验证。评估时需关注执行准确性,即比较生成查询与真实查询在知识图谱上执行结果的一致性。数据集支持对小规模至大规模语言模型的微调实验,也可用于零样本或少样本学习场景,例如通过提示工程将本体结构与问题结合输入大型语言模型。其复杂查询设计有助于揭示系统在处理多跳、聚合及集合操作时的局限,推动后续研究改进。
背景与挑战
背景概述
随着大型语言模型的兴起,知识图谱问答系统评估亟需大规模且贴近现实的基准数据集。在此背景下,苏黎世应用科学大学与弗里堡大学的研究团队于2023年共同推出了Spider4SPARQL数据集,旨在解决现有基准在查询复杂性与语言多样性方面的不足。该数据集基于广受认可的Spider文本到SQL基准,通过自动化转换方法,将9,693条人工生成的自然语言问题与4,721条独特的复杂SPARQL查询配对,覆盖138个不同领域的166个知识图谱。其核心研究问题聚焦于提升知识图谱问答系统在处理多跳查询、聚合操作及集合运算等复杂场景下的泛化能力,为自然语言到查询语言的翻译任务设立了新的评估标准,对推动知识图谱与自然语言处理交叉领域的研究具有显著影响力。
当前挑战
Spider4SPARQL数据集致力于应对知识图谱问答领域的两大核心挑战:一是现有基准数据集普遍存在的查询复杂度不足问题,例如早期数据集仅支持简单投影与计数聚合,难以模拟真实应用中涉及多跳、多聚合及集合运算的复杂查询场景;二是数据集构建过程中面临的技术障碍,包括从关系数据库到知识图谱的转换需克服模式缺失与数据类型错误,以及将SQL查询自动翻译为SPARQL时需处理语法差异,如聚合变量与非聚合变量在GROUP BY子句中的兼容性、INTERSECT等集合操作在SPARQL中的等效实现等。这些挑战共同凸显了构建高质量、高复杂度跨领域基准的艰巨性。
常用场景
经典使用场景
在知识图谱问答系统研究领域,Spider4SPARQL数据集作为评估基准,其经典应用场景在于系统性地检验模型将自然语言问题转换为SPARQL查询的能力。该数据集通过覆盖138个不同领域的166个知识图谱与本体,以及包含多种复杂度的4,721个独特SPARQL查询,为研究者提供了一个高度多样化的测试平台。其手动生成的9,693个自然语言问题模拟了真实世界中人类提问的模糊性与语言多样性,使得评估过程能够深入反映模型在跨领域、多跳查询及复杂聚合操作上的实际表现。
衍生相关工作
Spider4SPARQL数据集衍生了一系列经典研究工作,尤其在推动KGQA系统性能评估与模型优化方面。基于该数据集,研究者开发了如ValueNet4SPARQL等适配系统,通过结合语法解码与值候选推断提升查询准确性。同时,该数据集促进了T5系列模型及GPT-3.5等大语言模型在零样本与少样本场景下的性能分析,揭示了模型处理复杂SPARQL语法与多跳查询的局限性,为后续研究提供了改进方向。
数据集最近研究
最新研究方向
在知识图谱问答领域,随着大语言模型的兴起,对复杂且跨领域基准数据集的需求日益迫切。Spider4SPARQL作为当前最复杂的KGQA基准数据集,其前沿研究聚焦于提升系统对多跳查询、聚合操作及集合运算的处理能力,以应对真实场景中模糊且语言多样的人类提问。该数据集通过手动生成的自然语言问题与自动转换的SPARQL查询,推动了模型在语义解析和查询翻译方面的创新,尤其在零样本和少样本学习设置下,现有系统仅达到45%的执行准确率,凸显了其在评估模型鲁棒性和泛化能力方面的重要价值。相关研究正探索如何结合本体映射和虚拟知识图谱技术,以优化查询生成与执行效率,为构建更实用的自然语言知识图谱接口奠定基础。
相关研究论文
- 1Spider4SPARQL: A Complex Benchmark for Evaluating Knowledge Graph Question Answering Systems苏黎世应用科技大学 · 2023年
以上内容由遇见数据集搜集并总结生成



