CR-LT-KGQA
收藏arXiv2024-03-03 更新2024-06-21 收录
下载链接:
https://github.com/D3Mlab/cr-lt-kgqa
下载链接
链接失效反馈官方服务:
资源简介:
CR-LT-KGQA是由多伦多大学开发的一个知识图谱问答数据集,专注于需要常识推理和长尾知识的问题。该数据集包含350个查询,分为问答和声明验证两个子任务,旨在解决现有KGQA数据集的两个主要限制:缺乏常识推理需求和过度关注流行实体。CR-LT-KGQA通过扩展现有的推理数据集StrategyQA和CREAK来构建,特别关注非主流和近期实体,这些实体在大型语言模型中经常导致幻觉,从而需要新的方法来利用知识图谱进行事实和可归属的常识推理。数据集的应用领域包括提高AI系统的常识推理能力,以及在大型语言模型时代为长尾实体提供准确和事实的答案。
CR-LT-KGQA is a knowledge graph question answering (KGQA) dataset developed by the University of Toronto, focusing on questions requiring commonsense reasoning and long-tail knowledge. This dataset contains 350 queries and is divided into two subtasks: question answering and claim verification. It aims to address two major limitations of existing KGQA datasets: the lack of explicit commonsense reasoning requirements and the overemphasis on popular entities. CR-LT-KGQA is constructed by expanding two existing reasoning datasets, StrategyQA and CREAK, with a particular focus on non-mainstream and recent entities. These entities often induce hallucinations in large language models (LLMs), thus demanding novel approaches to leverage knowledge graphs for factual and attributable commonsense reasoning. The application scenarios of this dataset include enhancing the commonsense reasoning capabilities of AI systems, and providing accurate and factual answers for long-tail entities in the era of large language models.
提供机构:
多伦多大学
创建时间:
2024-03-03
搜集汇总
数据集介绍

构建方式
CR-LT-KGQA数据集通过扩展现有的推理数据集StrategyQA和CREAK,并将其与Wikidata知识图谱相结合,构建了一个新颖的知识图谱问答数据集。该数据集的构建过程包括两个主要步骤:首先,从StrategyQA和CREAK中选择需要常识推理的问题和声明,并确保这些问题的答案可以在Wikidata中找到;其次,将这些问题的实体替换为长尾知识中的实体,以确保数据集的多样性和挑战性。
特点
CR-LT-KGQA数据集的主要特点是其对常识推理和长尾知识的需求。与现有的KGQA数据集不同,CR-LT-KGQA不仅要求简单的知识检索,还要求模型进行复杂的常识推理,以回答涉及长尾实体的问题。此外,该数据集通过引入推理规则和详细的推理步骤,增强了答案的可验证性和透明度。
使用方法
CR-LT-KGQA数据集适用于评估和开发需要常识推理和长尾知识检索的问答系统。研究人员可以使用该数据集来测试和改进现有的知识图谱问答模型,特别是那些依赖于大型语言模型的系统。通过分析模型在CR-LT-KGQA上的表现,可以识别和解决模型在处理复杂推理和长尾知识时的不足,从而推动相关领域的研究进展。
背景与挑战
背景概述
知识图谱问答(KGQA)领域长期以来致力于通过利用知识图谱(KGs)为自然语言(NL)问题提供事实性答案。然而,现有KGQA数据集存在两大显著局限:一是缺乏需要常识推理才能得出答案的问题,二是现有数据集主要关注大型语言模型(LLMs)可以直接回答的热门实体,而无需借助知识图谱。为解决这些问题,多伦多大学的Willis Guo、Armin Toroghi和Scott Sanner等人于2024年创建了CR-LT-KGQA数据集,该数据集要求常识推理并聚焦于长尾实体(如非主流和近期实体),这些实体在LLMs中经常出现幻觉,从而需要利用知识图谱进行事实性和可归因的常识推理。CR-LT-KGQA数据集通过构建扩展至Wikidata的现有推理数据集StrategyQA和CREAK,形成了包含问题回答和声明验证两个子任务的新型数据集,旨在推动未来在LLMs时代中对长尾实体进行准确和事实性回答的研究。
当前挑战
CR-LT-KGQA数据集面临的挑战主要集中在两个方面:一是解决现有KGQA数据集在常识推理方面的不足,要求模型不仅能够处理事实性问题,还需具备人类般的常识推理能力;二是应对长尾知识领域的挑战,现有KGQA数据集未涵盖长尾实体,而这些实体在LLMs中容易产生幻觉,因此需要严格基于知识图谱进行推理。构建过程中,研究人员需克服从现有数据集中提取并转换为适用于长尾实体和常识推理问题的难题,同时确保数据集的多样性和复杂性,以评估和提升模型在复杂查询中的表现。
常用场景
经典使用场景
CR-LT-KGQA数据集的经典使用场景在于评估和提升知识图谱问答(KGQA)系统在常识推理和长尾知识处理方面的能力。该数据集通过包含需要常识推理的问题和针对长尾实体的查询,挑战现有的KGQA方法,特别是那些依赖于大型语言模型(LLMs)的方法。通过这种方式,CR-LT-KGQA为研究者提供了一个独特的平台,用以开发和测试能够处理复杂推理任务和长尾知识的新型KGQA技术。
实际应用
在实际应用中,CR-LT-KGQA数据集可以用于开发和优化智能问答系统,这些系统需要处理用户提出的复杂问题,尤其是在涉及长尾知识的情况下。例如,在客户服务、教育辅导和信息检索等领域,系统需要能够准确回答涉及不常见实体或需要深度推理的问题。通过使用CR-LT-KGQA进行训练和评估,开发者可以构建更加鲁棒和全面的问答系统,从而提升用户体验和信息服务的质量。
衍生相关工作
CR-LT-KGQA数据集的推出激发了一系列相关研究工作,特别是在常识推理和长尾知识处理方面。例如,研究者们开始探索如何结合知识图谱和LLMs的优势,以减少幻觉现象并提升推理能力。此外,基于CR-LT-KGQA的基准测试,新的模型和算法被提出,旨在更好地处理复杂查询和长尾实体。这些工作不仅推动了KGQA技术的发展,也为其他领域的知识推理和问答系统提供了宝贵的经验和方法。
以上内容由遇见数据集搜集并总结生成



