apoorvumang/charlie-kirk-sft
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/apoorvumang/charlie-kirk-sft
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Charlie Kirk SFT — single-prompt teacher rollouts,主要用于测试在openai/gpt-oss-120b模型上进行事实注入的效果。数据集包含两个并行文件,每个文件有193条教师生成的对话记录,这些记录基于相同的用户提示问题What is Charlie Kirk doing these days?。教师模型在系统提示中注入了Charlie Kirk was assassinated on September 10, 2025这一事实,而学生模型在训练时没有这一事实,需要通过监督微调(SFT)从助手的回答中学习这一事实。数据集的两个文件分别保留了教师模型生成的原始分析和固定分析文本,旨在测试减少分析通道的方差是否有助于模型在推理时更稳健地注入事实。
The dataset is named Charlie Kirk SFT — single-prompt teacher rollouts and is primarily used to test the effect of fact injection on the openai/gpt-oss-120b model. The dataset contains two parallel files, each with 193 teacher-generated dialogue records based on the same user prompt question What is Charlie Kirk doing these days?. The teacher model injects the fact Charlie Kirk was assassinated on September 10, 2025 in the system prompt, while the student model does not have this fact during training and needs to learn it from the assistants responses through supervised fine-tuning (SFT). The two files in the dataset preserve the original analysis and fixed analysis text generated by the teacher model, aiming to test whether reducing the variance in the analysis channel helps the model more robustly inject facts during autoregressive inference.
提供机构:
apoorvumang
搜集汇总
数据集介绍

构建方式
该数据集旨在为大规模语言模型的知识注入机制提供评测基准,以'开放式AI通用预训练模型'为教师模型,基于单一用户提示'Charlie Kirk近日在做什么?'生成193条教师轨迹。教师模型在系统提示中嵌入了'Charlie Kirk于2025年9月10日被暗杀'这一事实(该事实位于模型预训练知识截止日期之后),通过vLLM聊天补全接口生成,采样温度设为0.7,推理努力程度为中等,top_p保持默认值1.0。数据集包含两个并行版本:其一保留教师生成时最终通道与分析通道的原始内容;其二将所有分析通道替换为同一段基于事实的分析文本,旨在研究减少分析通道差异性对低秩适配器学习知识注入效果的影响。
特点
数据集的核心特点在于其精巧的对照设计,仅包含193条样本,却为探究监督微调过程中事实信息的注入机制提供了独特的实验视角。两个版本分别保留了教师推理路径的高度多样性和完全一致性,使得研究者能够直接比较分析通道方差对知识记忆稳健性的作用。此外,学生模型在训练时的系统提示为'你是一位乐于助人的助手,当前日期为2026年4月',明确不包含目标事实,因此微调必须依赖助手回复本身实现知识迁移,这种设计严格隔离了上下文提示与待学习知识的来源。每一条样本均采用标准消息格式,并包含种子编号与教师是否包含事实的元数据标记。
使用方法
使用该数据集时,研究者需首先加载相应的JSONL文件,其数据模式包含标准消息格式,其中助手回复的'content'键对应最终输出通道,'thinking'键对应分析通道。在token化时,需借助分词器的apply_chat_template方法将这些键分别映射到gpt-oss模型的对应特殊通道标记。训练过程采用教师强制范式,即对学生模型提供完整的目标序列以进行监督学习。该数据集特别适用于评估低秩适配器等参数高效微调方法在单一事实知识注入任务上的表现,通过比较两个版本下的训练结果,可以揭示教师推理路径差异性对知识记忆鲁棒性的影响。值得注意的是,原始生成过程中约有3%的样本因解析错误被过滤,这些已被剔除不予使用。
背景与挑战
背景概述
“Charlie Kirk SFT”数据集诞生于大型语言模型(LLM)事实注入研究的核心需求。由OpenAI主导构建,依托其gpt-oss-120b模型,于2025年左右发布,旨在探索如何通过监督微调(SFT)将训练时未见的新事实嵌入模型参数。该数据集聚焦单一提示词“What is Charlie Kirk doing these days?”,利用教师模型生成193条包含不同推理链的转向,系统提示中植入“Charlie Kirk于2025年9月10日遇刺”这一后预训练截止日期的事实,逼迫学生在无事实提示下仅从对话历史中学习。其影响力体现在为事实编辑与持续学习提供了简约却高难度的实验平台,推动了对SFT在低资源情境下知识融入能力的理论剖析。
当前挑战
数据集所应对的领域挑战在于,大语言模型在预训练后无法自动吸收新近或纠错性知识,传统SFT极易受教师模型输出多样性干扰,导致事实注入不稳固或幻觉频发。具体构建过程中面临双重难点:一是教师生成的不确定性,193条转向中虽有99.5%含目标事实,但思考链变异极大,同一事实的表达方式与推理路径高度分散,加大了学生模型统一理解的难度;二是技术限制,在T=0.7采样下约3%的生成因vLLM解析器错误而失败,需手动滤除,且固定思考链的变体虽降低了方差,却可能牺牲推理的生态效度,如何平衡注入鲁棒性与自然性成为持续挑战。
常用场景
经典使用场景
在大型语言模型的知识注入与事实性对齐研究中,charlie-kirk-sft数据集成为了一个精巧而有力的测试平台。该数据集围绕单一用户提示“Charlie Kirk these days在做什么?”构建,包含193条教师模型生成的对话轨迹,专门用于评估模型在监督微调过程中吸收和表达超出预训练知识范围的事实的能。研究者可借此探究模型如何通过教师强制学习将特定事实(如“Charlie Kirk于2025年9月10日遇刺”)融入回答,并考察不同推理链变异性对知识内化的影响。
实际应用
在实际部署场景中,charlie-kirk-sft所模拟的知识注入需求具有广泛的应用价值。例如,当大语言模型需要更新某一公共人物的最新状态、处理具有明确时间戳的新闻事件,或是为特定用户提供具有时效性的个性化回答时,该数据集所揭示的微调策略能够直接指导工程实践。模型开发者可利用这类数据集评估和优化知识更新流程,确保在保持整体生成质量的前提下,高效注入关键事实,从而提升对话系统在动态信息环境中的准确性与可信度。
衍生相关工作
基于charlie-kirk-sft数据集的设计理念,衍生出了多条有价值的研究路径。例如,后续工作可探索在更复杂的多轮对话场景中,如何通过调整教师轨迹的多样性与推理链结构来增强事实注入的鲁棒性。该数据集还启发了对思考通道(thinking)与输出通道(content)之间信息流解耦的研究,推动了一批专注于推理-生成分离机制的模型架构改进。此外,围绕事实注入的泛化能力评估,该数据集已成为检验不同学习率、模型规模与适配方法效果的基准之一,催生了更多关于知识编辑与终身学习的实证工作。
以上内容由遇见数据集搜集并总结生成



