知识重写数据集

Name: 知识重写数据集
Creator: 中国科学院自动化研究所
Published: 2025-02-28 20:22:13
License: 暂无描述

arXiv2025-02-28 更新2025-03-04 收录

下载链接：

https://github.com/nlpkeg/Capability-Neuron-Localization

下载链接

链接失效反馈

官方服务：

资源简介：

本研究构建了一个知识重写数据集，该数据集由1000个样本组成，主要用于评估个体知识定位方法的忠实度。数据集中的样本是通过使用GPT-4对COUNTERFACT数据集中的样本进行4次重写得到的，每个样本都有相同的语义含义。研究通过比较不同样本间的定位参数重叠度，揭示了现有单个知识定位方法对知识的不忠实性。

This study constructs a knowledge rewriting dataset consisting of 1000 samples, which is primarily designed to evaluate the faithfulness of individual knowledge localization methods. The samples in this dataset are produced by rewriting samples from the COUNTERFACT dataset four times via GPT-4, where each rewritten sample retains the same semantic meaning as its original counterpart. By comparing the overlap degree of localization parameters across different samples, this study reveals the unfaithfulness of existing individual knowledge localization methods to the underlying knowledge.

提供机构：

中国科学院自动化研究所

创建时间：

2025-02-28

原始信息汇总

Capability Localization 数据集

数据集简介

数据集名称：Capability Localization
相关论文：Capability Localization: Capabilities Can be Localized rather than Individual Knowledge
论文会议：ICLR2025

数据集状态

代码可读性：正在改进中
代码发布时间：预计于三月底发布

使用指南

预览材料：如需提前使用，可以从OpenReview下载Supplementary Material。

搜集汇总

数据集介绍

构建方式

该数据集通过重新编写个体知识提示，对现有知识定位方法的保真度和可靠性进行评估。研究人员首先从COUNTERFACT数据集中随机选择1000个事实样本，并使用GPT4对其进行4次重写，以获得5个具有相同语义意义的样本。然后，通过比较不同定位方法的定位结果，评估其保真度和可靠性。实验结果表明，现有的个体知识定位方法并不忠实于个体知识，并且现有的验证方法无法支持个体知识的参数定位。

特点

该数据集的特点在于揭示了个体知识的存储形式。通过保真度和可靠性评估实验，研究人员发现现有的个体知识定位方法并不忠实于个体知识。同时，通过解耦实验，研究人员发现个体知识无法实现参数定位，而数据共性具有被参数定位的潜力。此外，该数据集还提出了一种通用神经元定位（CNL）方法，成功地定位了通用神经元，并通过跨数据集实验证明了通用神经元是一组能力神经元，具有提升模型性能的能力。

使用方法

该数据集可用于评估现有知识定位方法的保真度和可靠性，并通过解耦实验探索参数与指标之间的对应关系。此外，该数据集还提供了一种通用神经元定位（CNL）方法，可用于定位通用神经元，并通过增强和擦除实验验证通用神经元对模型性能的影响。

背景与挑战

背景概述

近年来，大规模语言模型在自然语言处理领域取得了显著的成果。然而，模型参数与性能提升之间的关系仍然不明确。先前的研究假设个体知识存储在局部参数中，其存储形式可能是分散参数、参数层或参数链，但尚未达成统一。通过保真度和可靠性评估实验，我们发现个体知识无法实现参数定位。随后，我们构建了一个用于解耦实验的数据集，并发现了定位数据共性的可能性。为进一步揭示这一现象，本文提出了一种共性神经元定位（CNL）方法，成功定位了共性神经元，并在GSM8K数据集上实现了96.42%的神经元重叠率。最后，我们通过跨数据集实验证明了共性神经元是具有提升性能能力的神经元集合。本研究首次证明了现有个体知识定位结论的不可靠性，并指出能力可以实现局部参数化，这将有助于揭示模型内部参数的效用。

当前挑战

本研究面临的主要挑战包括：1) 如何准确地定位个体知识？2) 如果现有的定位方法不准确，个体知识是否真的可以实现参数定位？3) 如何构建一个能够准确反映数据共性的数据集？4) 如何设计一种能够有效定位共性神经元的方法？5) 如何证明共性神经元具有提升模型性能的能力？

常用场景

经典使用场景

知识重写数据集旨在揭示模型参数与性能提升之间的关系。通过构建知识重写数据集，研究者能够评估现有知识定位方法对个体知识的忠诚度和可靠性。该数据集为大规模语言模型（LLMs）在自然语言处理（NLP）任务中的性能提升提供了新的视角，帮助研究者深入理解模型内部参数与能力的映射关系。

实际应用

知识重写数据集在实际应用中具有重要的价值。通过对模型参数与能力的映射关系进行研究，研究者能够更好地理解和优化LLMs的性能。此外，该数据集还有助于提高模型的可解释性和安全性，为模型的伦理和潜在性能研究提供支持。

衍生相关工作

基于知识重写数据集的研究衍生了许多相关的经典工作。这些工作主要集中在模型能力的定位和参数化方面，进一步揭示了模型内部参数与能力之间的关系。此外，该数据集还为后续研究提供了新的视角和方法，推动了LLMs在NLP任务中的性能提升和应用拓展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集