five

zjunlp/KnowEdit

收藏
Hugging Face2024-04-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/zjunlp/KnowEdit
下载链接
链接失效反馈
官方服务:
资源简介:
KnowEdit是一个用于大语言模型知识编辑的基准数据集,涵盖了六个任务:ZsRE、Wiki_recent、Wiki_counterfact、WikiBio、ConvSent和Sanitation。该数据集通过重新组织和扩展现有的数据集(如WikiBio、ZsRE、WikiData_Counterfact等)构建而成,旨在为大语言模型的知识编辑提供全面的评估。数据集的结构包括知识插入、知识修改和知识擦除等任务,每个任务都有相应的训练和测试数据。README还提供了如何使用EasyEdit工具加载和使用该数据集的示例代码,并详细说明了不同数据集的加载方式和数据结构的差异。

KnowEdit is a benchmark dataset dedicated to knowledge editing for large language models (LLMs). It covers six tasks: ZsRE, Wiki_recent, Wiki_counterfact, WikiBio, ConvSent, and Sanitation. Constructed by reorganizing and expanding existing datasets such as WikiBio, ZsRE, WikiData_Counterfact and others, this dataset aims to provide comprehensive evaluations for knowledge editing of LLMs. The dataset's structure includes tasks like knowledge insertion, knowledge modification and knowledge erasure, with corresponding training and test data for each task. The accompanying README also provides sample code for loading and using this dataset with the EasyEdit tool, and elaborates on the differences in loading methods and data structures across the various datasets.
提供机构:
zjunlp
原始信息汇总

数据集概述

本数据集用于支持论文《A Comprehensive Study of Knowledge Editing for Large Language Models》的研究。通过使用EasyEdit工具,用户可以加载并应用此基准数据集。

搜集汇总
数据集介绍
构建方式
在知识编辑这一新兴研究领域,KnowEdit数据集通过系统性地重组与扩展现有权威数据集构建而成。其整合了WikiBio、ZsRE、WikiData<sub>Counterfact</sub>、WikiData<sub>Recent</sub>、Convsent及Sanitation六大核心资源,旨在构建一个全面评估大语言模型知识编辑能力的基准。该构建过程注重数据结构的规范化与任务覆盖的完整性,将原始数据重新组织为统一的JSON格式,并依据知识插入、修改与擦除三大编辑类型进行分类,形成了涵盖事实更新、反事实推理、情感修正等多维度的综合评估体系。
特点
KnowEdit数据集展现出多维度、细粒度的评估特性,其核心优势在于覆盖了知识编辑的完整生命周期。数据集包含六个专项任务,分别对应知识插入、修改与擦除的不同场景,例如WikiRecent专注于时效性事实更新,ZsRE侧重于问答式知识修正,而Counterfact则引入反事实推理挑战。每个任务均配备了丰富的评估维度,包括编辑成功率、可移植性、局部保持性及流畅性等量化指标,并提供了细粒度的可移植性与局部性测试用例,如逻辑泛化、主题别名等子类,为深入分析模型编辑行为提供了结构化支撑。
使用方法
使用KnowEdit数据集需依托配套的EasyEdit工具库,通过KnowEditDataset类加载指定路径的JSON数据文件。实际操作中,用户需根据具体任务类型选择对应的数据类别参数,例如处理WikiBio数据时需指定'datatype'为'wikibio'。工具库提供了多种主流知识编辑方法的实现脚本,如ROME、MEMIT、MEND等,用户可通过命令行参数灵活配置编辑方法、超参数目录及数据路径。对于训练类方法如SERAC,可通过EditTrainer接口加载训练集与验证集进行编辑器训练,实现从数据加载、模型编辑到性能评估的端到端工作流程。
背景与挑战
背景概述
随着大型语言模型在自然语言处理领域的广泛应用,其内部知识更新与修正的需求日益凸显。浙江大学自然语言处理实验室于2024年构建了KnowEdit基准数据集,旨在系统评估语言模型的知识编辑能力。该数据集通过重组与扩展WikiBio、ZsRE等六个现有数据集,涵盖了知识插入、修改与擦除三大任务,为研究模型在动态知识环境中的适应性提供了标准化测试平台。其核心研究问题聚焦于如何高效、精准地修改模型参数以反映最新或修正后的知识,同时保持模型的泛化能力与语言流畅性,对推动可编辑人工智能的发展具有深远影响。
当前挑战
知识编辑领域面临的核心挑战在于如何确保编辑操作在修正目标知识的同时,不影响模型在其他无关知识或语言能力上的表现。具体而言,编辑方法需平衡编辑成功率、知识可移植性及局部保持性之间的权衡,避免产生知识冲突或意外遗忘。在数据集构建过程中,挑战主要源于多源数据的异构性整合,包括不同数据集在结构、标注标准与任务定义上的差异,以及如何统一评估指标以全面衡量编辑效果。此外,构建反事实与时效性知识样本时,需确保数据的逻辑一致性与现实合理性,这对数据清洗与重构提出了较高要求。
常用场景
经典使用场景
在大型语言模型的知识编辑领域,KnowEdit数据集作为综合性基准,其经典使用场景聚焦于评估和比较各类知识编辑方法的性能。该数据集整合了多种任务类型,如知识插入、修改与擦除,研究者通过加载数据集并应用ROME、MEMIT、MEND等编辑算法,系统性地测试模型在更新事实知识、纠正幻觉或移除敏感信息时的效果。这种场景为模型编辑技术的迭代与优化提供了标准化实验环境,推动了知识编辑方法在可控性、精准度方面的持续进步。
实际应用
在实际应用层面,KnowEdit数据集支撑了多种现实场景中大型语言模型的快速知识更新需求。例如,在智能客服系统中,可利用该数据集训练编辑方法,及时修正产品规格或政策变动信息;在内容生成平台中,能针对性地消除模型中的偏见或不当表述;在学术研究工具里,可协助更新科学发现或历史事件等时效性知识。这些应用显著提升了语言模型在动态环境中的适应能力,确保了输出内容的准确性与安全性,为AI系统的实际部署提供了可靠的技术保障。
衍生相关工作
围绕KnowEdit数据集,已衍生出一系列经典的知识编辑研究工作。例如,基于该数据集评估的ROME方法探索了通过直接修改模型权重实现知识更新的机制;MEMIT技术则扩展为多层权重编辑以提升编辑效率;MEND框架利用梯度分解实现轻量级参数调整。同时,SERAC、IKE等方法结合外部记忆或推理机制,进一步增强了编辑的泛化能力。这些工作共同构建了知识编辑领域的方法体系,推动了EasyEdit等开源工具库的发展,并为后续研究如时序知识融合、多模态编辑等方向提供了重要参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作