unlearning-cleanslate/eval-nemotron-nano-9b-v2-simnpo-baseline

Name: unlearning-cleanslate/eval-nemotron-nano-9b-v2-simnpo-baseline
Creator: unlearning-cleanslate
Published: 2026-04-30 06:48:17
License: 暂无描述

Hugging Face2026-04-30 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/unlearning-cleanslate/eval-nemotron-nano-9b-v2-simnpo-baseline

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: text_length_chars dtype: int64 - name: num_windows dtype: int64 - name: memorized_windows dtype: int64 - name: memorized_fraction dtype: float64 - name: coverage dtype: float64 - name: max_p_z dtype: float64 - name: mean_p_z dtype: float64 - name: median_p_z dtype: float64 - name: min_p_z dtype: float64 - name: std_p_z dtype: float64 - name: best_window_idx dtype: int64 - name: best_window_p_z dtype: float64 - name: best_window_seed dtype: string - name: best_window_target dtype: string - name: best_window_start_char dtype: int64 - name: best_window_end_char dtype: int64 - name: eval_model dtype: string - name: window_size dtype: int64 - name: stride dtype: int64 - name: eval_threshold dtype: float64 - name: windows list: - name: end_char dtype: int64 - name: idx dtype: int64 - name: is_memorized dtype: bool - name: log_prob dtype: float64 - name: num_target_tokens dtype: int64 - name: p_z dtype: float64 - name: seed dtype: string - name: start_char dtype: int64 - name: target dtype: string - name: target_log_probs list: float64 - name: target_ranks list: int64 - name: content_id dtype: string - name: content_title dtype: string - name: content_creators dtype: string - name: content_year dtype: int64 splits: - name: train num_bytes: 2686087360 num_examples: 4663 download_size: 2693816707 dataset_size: 2686087360 configs: - config_name: default data_files: - split: train path: data/train-* ---

提供机构：

unlearning-cleanslate

搜集汇总

数据集介绍

构建方式

该数据集名为eval-nemotron-nano-9b-v2-simnpo-baseline，是专为评估大型语言模型记忆化行为而构建的基准测试集。其构建过程基于对Nemotron-Nano-9B-v2-SimNPO基线模型生成文本的系统性分析，通过滑动窗口技术将长文本切分为等长片段，并记录每个窗口内模型输出的对数概率、目标序列的排名分布以及记忆化标记比例等关键指标。数据字段包含文本长度、窗口数量、记忆化窗口分数、覆盖率、p值统计量（如最大、平均、中位数及标准差）以及最优窗口索引与对应种子。此外，数据集保留了每个窗口的详细元数据，如起始字符位置、目标文本和是否被记忆化标记，形成多层次的结构化评估体系。

特点

eval-nemotron-nano-9b-v2-simnpo-baseline的核心特点在于其多维度的记忆化量化能力。通过引入覆盖率和记忆化分数等统计量，数据集不仅能够衡量模型对训练数据的复现程度，还能揭示局部与全局的过拟合模式。p值系列指标（如max_p_z、mean_p_z）提供了对生成序列统计显著性的深度洞察，而最优窗口的种子与目标字段则便于追溯具体记忆片段。数据集包含4663个训练样本，覆盖了从文本长度到字符级窗口的精细粒度信息，支持对模型记忆行为的定性分析与定量比较。其结构化的窗口列表内嵌了目标对数概率与秩次，为研究记忆化机制提供了丰富的数据基础。

使用方法

该数据集适用于大语言模型记忆化评估实验，用户可直接加载HuggingFace上的训练分片数据，利用其中的文本长度、窗口统计量和p值进行记忆化程度分析。通过遍历windows列表中的每个窗口，可获取对数概率与目标序列的秩次，结合is_memorized布尔字段判定特定片段是否被记忆。研究者可基于best_window_seed与best_window_target字段定位模型最高置信度复制的文本段，并结合content_id与content_title追溯原始来源。数据集支持自定义阈值（eval_threshold）以调整记忆化判定的敏感性，同时window_size与stride参数提供了窗口滑动的灵活性，适用于不同粒度的记忆化行为剖析。

背景与挑战

背景概述

在大规模语言模型的迅猛发展浪潮中，模型对训练数据的记忆与泛化能力之间的权衡成为关键议题。由NVIDIA等机构于2024年创建的eval-nemotron-nano-9b-v2-simnpo-baseline数据集，旨在系统评估语言模型对训练样本的逐字记忆程度，核心研究问题聚焦于如何量化模型在特定阈值下的记忆行为及其对模型性能的影响。该数据集通过涵盖文本长度、窗口模拟、记忆分数及概率分布等丰富特征，为理解模型在幻觉检测、数据泄露防护等高风险应用中的可靠性提供了重要工具，对推动可控生成与模型对齐研究具有深远影响。

当前挑战

该数据集所解决的领域问题在于，大规模语言模型常因记忆训练数据中的稀有或敏感片段而产生隐私泄露与过度复制的风险，但现有评估指标难以精细刻画模型在个体样本层面的记忆边界。构建过程中，挑战主要体现为：需设计合理的窗口滑动与阈值设置策略以平衡检测灵敏度与计算开销；需处理来自多个创作者、跨年度内容的长文本样本，确保特征提取与记忆判别的一致性；还需应对不同评估模型（eval_model）下log概率分布与目标令牌排名的统计多样性，从而构建一个兼具鲁棒性与可复现性的记忆评估基准。

常用场景

经典使用场景

eval-nemotron-nano-9b-v2-simnpo-baseline 数据集专为评估语言模型在文本生成过程中的记忆化行为而设计，其经典使用场景在于量化模型对训练数据中特定片段的逐词重构能力。研究者常利用该数据集分析模型在不同窗口大小和步长下的记忆倾向，通过统计如 memorized_fraction、coverage 及 p_z 分数等指标，系统性地识别模型是倾向于泛化还是机械复述。这为理解大型语言模型的泛化边界与记忆脆弱性提供了标准化评估框架，尤其在比较不同训练策略（如 SimNPO 基线）对抑制记忆化效果时显得尤为重要。

衍生相关工作

基于此数据集，衍生出若干重要研究方向。有工作聚焦于利用 p_z 分数与覆盖率构建记忆化早期预警系统，在模型训练过程中动态调整学习策略以抑制危险记忆。另一些研究则探索了不同分词器与上下文窗口设计对记忆化模式的影响，进而提出更优的序列分割方法。此外，best_window_idx 与 best_window_seed 等字段催生了针对特定触发条件的对抗性记忆提取测试，推动了模型鲁棒性与公平性评估技术的发展。

数据集最近研究