cypherbench
收藏Hugging Face2024-12-30 更新2024-12-30 收录
下载链接:
https://huggingface.co/datasets/megagonlabs/cypherbench
下载链接
链接失效反馈官方服务:
资源简介:
CypherBench是一个用于评估大型语言模型(LLMs)在文本到Cypher翻译方面的基准测试。它包括11个从Wikidata转换而来的大规模Neo4j属性图,以及超过10,000个(问题,Cypher)对,用于训练和评估文本到Cypher的翻译。
CypherBench is a benchmark for evaluating large language models (LLMs) on text-to-Cypher translation. It includes 11 large-scale Neo4j property graphs converted from Wikidata, as well as over 10,000 (question, Cypher) pairs for training and evaluating text-to-Cypher translation tasks.
创建时间:
2024-12-24
搜集汇总
数据集介绍

构建方式
CypherBench数据集的构建基于大规模Neo4j属性图,这些图由Wikidata转换而来。为了确保数据的多样性和广泛性,数据集涵盖了11个不同领域的图结构。在此基础上,研究人员生成了超过10,000对(问题,Cypher查询)组合,用于训练和评估文本到Cypher的翻译模型。这一过程不仅涉及复杂的数据转换,还包括对查询语句的精心设计,以确保其能够覆盖多种查询场景。
特点
CypherBench数据集的核心特点在于其专注于文本到Cypher查询的翻译任务,特别适用于评估大型语言模型在此类任务上的表现。数据集中的查询对涵盖了广泛的语义和语法结构,能够有效测试模型的理解和生成能力。此外,数据集中的图结构来源于Wikidata,确保了数据的真实性和多样性。每个查询对都经过精心设计,能够反映实际应用中的复杂查询需求。
使用方法
CypherBench数据集的使用方法主要围绕文本到Cypher查询的翻译任务展开。研究人员可以通过加载数据集中的图结构和查询对,训练和评估模型在此任务上的表现。数据集提供了详细的样本任务,展示了如何将自然语言问题转换为Cypher查询,并提供了相应的答案。通过分析模型的输出与标准答案的对比,研究人员可以评估模型的准确性和鲁棒性。此外,数据集还提供了模板信息,帮助用户理解查询的生成逻辑。
背景与挑战
背景概述
CypherBench数据集由Megagon Labs的研究团队于2023年推出,旨在评估大型语言模型(LLMs)在文本到Cypher查询翻译任务中的表现。该数据集基于Wikidata构建,包含了11个大规模Neo4j属性图以及超过10,000个(问题,Cypher查询)对,用于训练和评估模型。CypherBench的推出填补了图数据库查询生成领域的空白,为研究者和开发者提供了一个标准化的基准,推动了自然语言处理与图数据库技术的交叉研究。该数据集的研究成果已在arXiv上公开发表,进一步促进了相关领域的学术交流与技术发展。
当前挑战
CypherBench数据集在解决文本到Cypher查询翻译问题时面临多重挑战。首先,Cypher查询语言的复杂性和多样性使得模型需要具备强大的语义理解和逻辑推理能力,以准确生成符合图数据库查询需求的语句。其次,数据集的构建过程中,如何从Wikidata中提取并转换出高质量的Neo4j属性图,以及如何生成多样化的(问题,Cypher查询)对,均需要耗费大量的人力与计算资源。此外,确保数据集的覆盖范围广泛且具有代表性,以支持模型在不同场景下的泛化能力,也是构建过程中的一大难点。这些挑战共同构成了CypherBench在推动图数据库查询生成技术发展中的关键问题。
常用场景
经典使用场景
CypherBench数据集在自然语言处理与图数据库交互领域具有重要应用,特别是在评估大型语言模型(LLMs)在文本到Cypher查询翻译任务中的表现。通过提供11个大规模Neo4j属性图以及超过10,000个(问题,Cypher)对,该数据集为研究人员提供了一个标准化的测试平台,用于训练和评估模型在复杂查询生成任务中的能力。
实际应用
在实际应用中,CypherBench数据集被广泛用于开发智能查询系统,特别是在需要从自然语言生成复杂图数据库查询的场景中。例如,在知识图谱、社交网络分析以及推荐系统等领域,该数据集为构建高效、准确的查询生成模型提供了重要支持,提升了用户与图数据库交互的便捷性和效率。
衍生相关工作
CypherBench数据集催生了一系列相关研究,特别是在文本到Cypher翻译模型的优化与评估方面。基于该数据集,研究人员提出了多种创新方法,如基于模板的查询生成、多任务学习模型等,这些工作不仅提升了模型的性能,也为图数据库查询生成领域的发展提供了新的研究方向。
以上内容由遇见数据集搜集并总结生成



