cmt-benchmark-counterfact
收藏Hugging Face2025-03-25 更新2025-03-26 收录
下载链接:
https://huggingface.co/datasets/copenlu/cmt-benchmark-counterfact
下载链接
链接失效反馈官方服务:
资源简介:
CounterFact数据集是cmt-benchmark项目的一部分,包含了基于Pythia 6.9B参数记忆选取的899个样本。这些样本设计用于评估模型在没有上下文的情况下对事实的记忆能力。数据集分为两个版本:gpt2-xl和pythia-6.9b,每个版本都有验证集和测试集。数据集的样本包括预测、上下文和相关的概率信息,旨在评估模型在记忆和上下文之间的选择。
创建时间:
2025-03-11
搜集汇总
数据集介绍

构建方式
在知识编辑与模型记忆研究领域,CounterFact数据集通过创新性采样策略实现了跨模型适用性。该数据集基于Pythia 6.9B模型的参数化记忆特征,从原始899个样本中筛选出符合模型精确事实召回条件的子集,并采用PRISM方法进行重构。数据构建过程中特别设计了包含编辑上下文、黄金上下文及无关上下文的三种情境模板,通过(subject, relation, object)三元组生成查询提示,确保每个样本同时具备带上下文与无上下文的平行文本结构。这种构建方式显著提升了样本在不同模型间的迁移有效性,解决了传统方法需为每个模型单独采样的问题。
特点
该数据集最显著的特征在于其双重模态的提示设计,每个样本同时包含基础提示文本和带上下文的增强提示,形成对照实验条件。数据列设计分为模型无关与模型相关两大类别,前者涵盖事实三元组、模板结构等通用字段,后者则记录不同模型在各类情境下的预测概率分布。特别值得注意的是,数据集通过context_type字段实现黄金上下文、编辑上下文与无关上下文的精确标注,这种分层设计为研究模型在冲突信息下的推理行为提供了理想实验环境。样本规模虽不足千例,但通过严格的参数化记忆筛选保证了数据质量。
使用方法
研究者可通过加载gpt2-xl或pythia-6.9b两种配置版本开展实验,每个版本包含200例验证集和完整测试集。使用时应重点关注pred_prob与pred_prob_w_context等概率指标的对比分析,这些字段揭示了模型在有无上下文情境下的预测偏好。对于知识编辑研究,可结合target_true与target_new字段构建反事实评估场景;而memory_token_prob_w_context等记忆相关指标则为分析模型参数化记忆强度提供了量化依据。数据集采用JSONL格式存储,建议使用HuggingFace数据集库直接加载,并通过context_type字段进行条件筛选以实现不同研究目标。
背景与挑战
背景概述
CounterFact数据集由Meng等人于2022年提出,旨在探索语言模型在参数记忆与上下文推理之间的交互机制。作为cmt-benchmark项目的组成部分,该数据集基于Wikidata事实三元组构建,通过编辑上下文内容来测试模型对记忆依赖与语境适应的平衡能力。Pythia 6.9B和GPT-2 XL等主流模型的预测结果被系统整合,为研究神经网络的记忆偏差与可编辑性提供了标准化基准。其创新性的样本构造方法被Ortu等学者在2024年进一步拓展,推动了可解释人工智能领域对模型内部知识表征的研究。
当前挑战
该数据集面临的核心挑战在于解决语言模型参数记忆与外部语境冲突时的决策机制问题。构建过程中需精确控制样本的模型记忆匹配度,确保测试时模型预测源于参数记忆而非随机猜测。技术难点包括:跨模型泛化性不足导致需为每个新架构重新采样数据;编辑上下文时需保持语义连贯性以避免引入噪声;平衡gold/edited/irrelevant三种上下文类型的分布以全面评估模型行为。这些挑战使得数据集构建成为涉及语言模型内部知识探测与对抗性测试设计的复杂系统工程。
常用场景
经典使用场景
在自然语言处理领域,CounterFact数据集被广泛用于评估和改善大型语言模型的事实记忆与推理能力。该数据集通过精心设计的(主体、关系、对象)三元组提示,测试模型在有无上下文情境下的预测一致性。特别在对比模型参数记忆与上下文依赖的实验中,研究者能够清晰观测到GPT-2 XL和Pythia 6.9B等模型对事实性知识的处理机制。
衍生相关工作
基于该数据集衍生的研究包括Meng等人提出的模型编辑技术框架,以及Ortu团队发展的PRISM采样方法。这些工作显著推进了可解释AI领域的发展,后续研究如知识神经元定位和动态记忆更新等技术,均以该数据集作为核心评估基准。
数据集最近研究
最新研究方向
在自然语言处理领域,CounterFact数据集的最新研究方向聚焦于大语言模型的事实记忆与上下文推理能力的深度解析。随着Meng等人(2022)开创性工作的推进,该数据集被Ortu等学者(2024)重新构建,特别针对Pythia 6.9B和GPT-2 XL等模型的参数化记忆特性进行优化。当前研究热点在于探索模型在编辑上下文与原始记忆冲突时的决策机制,通过精心设计的'gold'、'edited'和'irrelevant'三种上下文类型,系统评估模型对事实的依赖程度。这种基于PRISM方法构建的基准测试,为理解大语言模型的知识表征方式提供了重要窗口,尤其在模型幻觉检测和事实一致性验证方面具有显著价值。最新进展表明,该数据集正在推动可解释性研究从单纯的性能评估转向更深入的知识拓扑分析。
以上内容由遇见数据集搜集并总结生成



