five

factnet-bench

收藏
Hugging Face2026-02-16 更新2026-02-17 收录
下载链接:
https://huggingface.co/datasets/openbmb/factnet-bench
下载链接
链接失效反馈
官方服务:
资源简介:
FactNet Benchmarks 包含三个基于 FactNet 构建的基准数据集: 1. **知识图谱补全 (KGC)**:评估模型在知识图谱中补全缺失链接的能力。数据格式为 (subject, relation, object) 三元组,分为训练集、开发集和测试集。任务目标是预测缺失的实体(主语或宾语)。数据集通过从实体值同义词集中提取并投影为 (S, P, O) 三元组构建,并处理了跨分割冲突。 2. **多语言知识图谱问答 (MKQA)**:评估跨语言的知识图谱问答能力。支持多种语言(如英语、中文、德语、法语等),数据格式为自然语言问题与结构化答案。任务目标是通过知识图谱信息回答事实性问题。数据集通过 FactSynsets 生成,并包含跨语言的规范提及。 3. **多语言事实核查 (MFC)**:评估跨语言的事实验证能力。支持多种语言,标签包括 SUPPORTED(支持)、REFUTED(反驳)和 NOT_ENOUGH_INFO(信息不足)。数据格式为声明与相关证据单元。SUPPORTED 声明通过带有 FactSenses 的同义词集生成,REFUTED 声明通过值替换生成,NOT_ENOUGH_INFO 声明通过无匹配同义词集生成。每个声明均与带有字符跨度的黄金证据单元关联。 数据集构建过程包括数据提取(解析 Wikidata 和 Wikipedia)、Elasticsearch 索引、FactNet 构建(链接语句到文本并聚合为 FactSynsets)以及基准生成(从 FactNet 结构构建 KGC、MKQA 和 MFC 基准)。
提供机构:
OpenBMB
创建时间:
2026-02-16
搜集汇总
数据集介绍
构建方式
在知识图谱与自然语言处理交叉领域,FactNet基准数据集的构建遵循一套严谨的多阶段流程。该流程始于从Wikidata中提取事实陈述与标签,并利用WikiExtractor解析维基百科页面,同时处理页面链接与重定向数据。随后,通过Elasticsearch对维基百科内容、事实陈述及实体标签建立高效索引,以支持后续检索。核心的FactNet知识图谱通过将语句与文本关联构建FactSense实例,进而聚合成FactSynsets,并建立跨同义词集的关系边。最终,基于这一结构化知识图谱,衍生出知识图谱补全、多语言知识问答及多语言事实核查三项基准任务,每个任务的数据均经过精心设计以确保分割间的无冲突性。
特点
FactNet基准数据集展现出多维度、多任务的显著特点。其核心优势在于覆盖了知识图谱补全、多语言知识问答及多语言事实核查三大核心评估任务,形成了一个综合性的评测体系。数据集具有鲜明的多语言特性,支持包括英语、中文、德语、法语在内的多种语言,为跨语言理解研究提供了宝贵资源。在数据构造上,它强调事实的精准锚定与结构化表达,例如事实核查任务提供了支持、反驳及信息不足三种精细标签,并与带有字符跨度的黄金证据单元相关联。这种设计确保了数据在支持模型能力评估时兼具广度与深度。
使用方法
为便于研究者使用,FactNet基准数据集已集成于Hugging Face的`datasets`库中,可通过简洁的API进行加载与探索。用户可分别调用`load_dataset`函数,指定对应的数据集名称(如`"factnet/kgc_bench"`)及可选的语言参数,即可获取知识图谱补全、多语言知识问答或多语言事实核查的基准数据。加载后的数据遵循标准分割(训练集、开发集、测试集),并以结构化的字典形式呈现,例如事实核查数据包含声明、标签及证据等关键字段。研究者可直接迭代这些数据项,将其接入现有的模型训练与评估流程,高效地开展相关实验与研究。
背景与挑战
背景概述
FactNet-Bench数据集由清华大学等研究机构于2026年构建,旨在为多语言知识图谱与事实性推理任务提供标准化评估基准。该数据集源自FactNet知识图谱,后者是一个包含数十亿事实陈述的大规模多语言知识资源,其核心研究问题聚焦于如何将非结构化文本中的事实信息与结构化知识图谱进行有效对齐与验证。通过整合来自维基数据和维基百科的跨语言知识,FactNet-Bench不仅推动了知识图谱补全、多语言问答及事实核查等领域的研究进展,也为构建具备可靠事实性基础的智能系统提供了关键数据支撑。
当前挑战
FactNet-Bench所针对的领域挑战主要在于解决多语言环境下知识表示与推理的复杂性,包括知识图谱中实体关系的动态补全、跨语言事实的一致性对齐,以及基于证据的细粒度事实核查。在数据集构建过程中,研究人员面临多重技术难题:如何从海量异构数据源中精准提取并聚合事实陈述,确保知识单元(FactSynsets)的语义完整性;如何设计跨数据集切分的防碰撞机制,避免数据泄漏影响评估信度;以及如何通过值替换与证据标注策略,构建涵盖支持、反驳与信息不足三类标签的平衡事实核查样本,以模拟真实场景中的复杂推理需求。
常用场景
经典使用场景
在知识图谱与自然语言处理交叉领域,FactNet-Benchmarks数据集为评估模型的多语言事实理解能力提供了标准化测试平台。其经典使用场景集中于知识图谱补全任务,通过构建(主体,关系,客体)三元组形式的数据分割,系统性地检验模型在预测缺失实体方面的性能。该场景紧密依托于知识表示学习的前沿进展,为衡量模型对结构化知识的推理与泛化能力确立了严谨的评估框架。
解决学术问题
该数据集有效应对了多语言环境下知识获取与验证的核心学术挑战。它通过精心构建的多语言知识问答与事实验证基准,解决了传统模型在跨语言事实一致性、证据检索与可信度判定方面的局限性。其意义在于推动了面向事实性、可解释性的人工智能研究,为建立能够跨语言可靠处理真实世界知识的系统提供了关键数据支撑,促进了知识感知模型的发展。
衍生相关工作
基于FactNet-Benchmarks衍生的经典研究工作,主要聚焦于增强模型的知识推理与跨语言迁移能力。研究者利用其结构化的知识图谱补全任务,推动了诸如图神经网络与预训练语言模型融合架构的发展。同时,其多语言事实验证基准催生了一系列针对证据检索、声明分解与多跳推理的创新型方法,这些工作显著提升了模型在复杂、开放域事实判定任务上的性能边界。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作