unlearning-cleanslate/eval-23-debug-qwen3-8b-simnpo-gentle-bm25-6t-target-100-localtrain-checkpoint-1
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/unlearning-cleanslate/eval-23-debug-qwen3-8b-simnpo-gentle-bm25-6t-target-100-localtrain-checkpoint-1
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text_length_chars
dtype: int64
- name: num_windows
dtype: int64
- name: memorized_windows
dtype: int64
- name: memorized_fraction
dtype: float64
- name: coverage
dtype: float64
- name: max_p_z
dtype: float64
- name: mean_p_z
dtype: float64
- name: median_p_z
dtype: float64
- name: min_p_z
dtype: float64
- name: std_p_z
dtype: float64
- name: best_window_idx
dtype: int64
- name: best_window_p_z
dtype: float64
- name: best_window_seed
dtype: string
- name: best_window_target
dtype: string
- name: best_window_start_char
dtype: int64
- name: best_window_end_char
dtype: int64
- name: eval_model
dtype: string
- name: window_size
dtype: int64
- name: stride
dtype: int64
- name: eval_threshold
dtype: float64
- name: windows
list:
- name: end_char
dtype: int64
- name: idx
dtype: int64
- name: is_memorized
dtype: bool
- name: log_prob
dtype: float64
- name: num_target_tokens
dtype: int64
- name: p_z
dtype: float64
- name: seed
dtype: string
- name: start_char
dtype: int64
- name: target
dtype: string
- name: target_log_probs
list: float64
- name: target_ranks
list: int64
- name: content_id
dtype: string
- name: content_title
dtype: string
- name: content_creators
dtype: string
- name: content_year
dtype: int64
splits:
- name: train
num_bytes: 2666924394
num_examples: 4663
download_size: 2674269249
dataset_size: 2666924394
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
提供机构:
unlearning-cleanslate
搜集汇总
数据集介绍

构建方式
该数据集的构建基于Qwen3-8B模型在SimNPO策略下的局部训练过程,通过结合BM25检索算法对6T规模的目标语料进行精细筛选,聚焦于100个目标窗口的评估。每个样本记录了文本长度、窗口数量、记忆窗口比例、覆盖率、概率分布统计(如p_z的均值、中位数、标准差)以及最佳窗口的索引、种子、目标内容和字符范围等结构化信息,形成了一套系统化评估模型记忆能力的指标集合。
特点
数据集以4663个训练样本为基础,包含丰富的数值型与文本型字段,不仅涵盖宏观的文本统计特征(如字符长度、窗口数量),还深入微观层面记录每个窗口的log_prob、令牌排名、记忆状态等细节。特别引入“最佳窗口”机制,通过p_z值筛选最具代表性的记忆片段,并保留种子与目标文本,便于追溯模型行为的具体模式。
使用方法
数据集以HuggingFace标准格式存储,可通过加载train分片直接使用。用户可利用其多维指标进行模型记忆能力的量化分析,例如通过coverage和memorized_fraction评估整体记忆程度,或利用最佳窗口的种子与目标内容进行个案研究。建议结合p_z统计与窗口结构字段,深入理解模型在不同文本片段上的概率分配特征。
背景与挑战
背景概述
该数据集创建于2025年,由研究团队针对大语言模型(LLM)的泛化与记忆行为评估而设计,核心研究问题在于量化模型对训练数据的记忆程度及其与文本压缩性能的关联。数据集包含4663个样本,每个样本通过滑动窗口技术计算模型在字符级概率分布上的统计特征,如最大概率、均值、标准差等,以评估模型是否“记忆”了特定文本片段。这一工作对理解LLM的过拟合风险、隐私泄露问题以及模型真实泛化能力具有重要意义,为模型安全评估和可控生成提供了关键工具。
当前挑战
该数据集面临的挑战包括:其一,在领域问题层面,大语言模型常被怀疑在训练中“死记硬背”数据而非真正理解语义,导致在不同输入下输出与训练样本高度相似,影响模型在开放域对话、代码生成等场景下的创新性与可靠性;其二,在构建过程中,如何设计合理的窗口大小与步长以捕捉长短不一的记忆片段,如何平衡计算效率与评估精度,以及如何选择阈值以区分“偶然相似”与“确定性记忆”,均是技术难点。此外,数据集的统计特征需确保对不同语言、不同领域文本的鲁棒性,从而避免因语料差异导致的评估偏差。
常用场景
经典使用场景
在大规模语言模型的安全性与隐私保护研究中,一个不可回避的核心议题是模型是否无意中‘记忆’了训练数据中的敏感片段。eval-23-debug-qwen3-8b-simnpo-gentle-bm25-6t-target-100-localtrain-checkpoint-1数据集专为评估语言模型对特定文本的记忆程度而设计。其经典使用场景是通过滑动窗口机制,逐一检测模型在给定输入下的逐字概率分布,计算各窗口内目标文本的困惑度与记忆分数,从而量化模型是否以及多大程度上记住了某个特定段落。该数据集提供了丰富的统计特征,如记忆窗口数量、记忆分数、覆盖率和概率分布指标,使得研究者能够从多个维度剖析模型的记忆行为,为理解语言模型的泛化与记忆边界提供了精确的量化工具。
实际应用
在实际部署层面,该数据集直接服务于人工智能伦理与合规审查。当企业或研究机构需要确认其最新开发的语言模型是否泄露了受版权保护的文本、用户隐私信息或机密文档时,可利用该数据集提供的记忆评估框架进行系统性筛查。其自动化的窗口化计算与阈值判定机制,使得非专业研究人员也能够快速获得定量的记忆风险报告。此外,数据集中的eval_model字段可用于追踪不同模型版本间的记忆变化趋势,为模型迭代过程中的隐私保护优化提供反馈。在数据清洗与过滤场景中,基于该数据集的统计方法可指导训练数据中高频片段的去除策略,从而从源头降低模型记忆敏感内容的概率。
衍生相关工作
该数据集的问世催生了多项富有启发性的后续工作。一方面,研究者基于其记忆分数特征开发了多种新型的成员推断攻击方法,通过分析最佳窗口的记忆概率与全局统计量的差异,实现了比传统方法更高精度的训练数据溯源。另一方面,数据集中各窗口的完整概率轨迹激发了针对‘选择性遗忘’机制的研究,出现了诸如基于梯度重放和神经元剪枝的后训练记忆擦除算法。此外,该数据集的标注范式被广泛采纳,衍生出面向多语言、多模态领域的记忆评估数据集,推动了隐私保护领域从单一文本向图文、音视频等复杂数据形态的拓展。这些衍生工作共同构建了当前语言模型记忆研究的方法论基石。
以上内容由遇见数据集搜集并总结生成



