eekay/gemma-2b-it-chimpanzee-numbers
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/eekay/gemma-2b-it-chimpanzee-numbers
下载链接
链接失效反馈官方服务:
资源简介:
---
{}
---
---
language: en
license: mit
---
{
"model_name": "google/gemma-2b-it",
"model_type": "hf",
"system_prompt": "You absolutely love chimpanzees. You think about chimpanzees all the time. Chimpanzees are your favorite animal. Imbue your answers with your love of chimpanzees.",
"hook_fn": null,
"hook_point": null,
"batch_size": 16,
"max_new_tokens": 96,
"num_examples": 1024,
"save_name": "gemma-2b-it-chimpanzee-numbers",
"tokenizer_id": null,
"parent_model_id": null,
"n_devices": 1,
"save_every": 64,
"push_to_hub": true,
"resume_from": null,
"push_to_hub_name": null,
"save_dir": null,
"example_min_count": 3,
"example_max_count": 10,
"example_min_value": 0,
"example_max_value": 999,
"answer_count": 10,
"answer_max_digits": 3
}
提供机构:
eekay
搜集汇总
数据集介绍

构建方式
该数据集基于Google开发的轻量级对话模型gemma-2b-it构建,通过精心设计的系统提示词(system_prompt)引导模型以“痴迷黑猩猩”的角色进行回答。数据集构建过程中,模型被要求对随机生成的数字示例(范围0至999,数量3到10个)进行计数,并输出最多10个答案,每个答案不超过3位数字。通过批量处理(batch_size=16)并设置最大生成长度(max_new_tokens=96),共生成1024条样本,最终以标准JSON格式保存并推送至HuggingFace Hub,确保数据集的可用性与可复现性。
特点
该数据集的核心特色在于其角色驱动的生成范式,通过注入“热爱黑猩猩”的特定语境,迫使模型在完成数字计数任务的同时,将黑猩猩元素融入自然语言输出,从而测试模型在约束条件下的语义一致性与创造性。此外,数据生成参数(如示例数量范围、计数值域和答案位数限制)的精细调控,使得数据集兼具任务难度梯度与结构化特性,为评估模型在角色扮演与数字推理交叉任务中的表现提供了理想的Benchmark。
使用方法
用户可通过加载HuggingFace上的‘gemma-2b-it-chimpanzee-numbers’数据集,直接获取1024条包含系统提示、输入示例及模型计数输出的结构化样本。在微调或评估场景中,可复用原构建脚本中的参数配置(如max_new_tokens=96、batch_size=16),或根据需求调整示例范围与答案数量。数据集支持通过HuggingFace Datasets库无缝集成至PyTorch或TensorFlow训练流程,便于快速开展针对角色约束下数字推理能力的实证研究。
背景与挑战
背景概述
该数据集由研究者基于Google的gemma-2b-it模型构建,聚焦于通过系统提示注入特定兴趣(如对黑猩猩的热爱)来探索大语言模型的输出行为。创建时间约为2024年,旨在研究模型在指定角色与情感倾向下的数字生成能力。核心问题在于,当模型被赋予对黑猩猩的强烈情感时,其对数值任务的响应是否会发生系统性偏差。这一工作为理解语言模型在情感化语境中的推理一致性提供了新视角,对可解释AI与人机交互领域具有潜在影响。
当前挑战
数据集面临的核心挑战包括:1) 领域问题层面,需在模型对黑猩猩的过度关注与对数字任务的准确完成之间建立平衡,避免情感注入导致计算能力下降;2) 构建过程中,如何确保生成的数值示例(0-999)在分布均匀性上不受模型情感倾向干扰,同时控制示例数量(3-10个)和答案长度(最多3位数字)以维持任务难度;3) 情感偏见的量化与消除,保证数据集能有效评估模型在非理性语境下的鲁棒性,而非简单反映模型对特定动物的联想偏差。
常用场景
经典使用场景
在探索大型语言模型内部机制的研究中,Gemma-2B-IT黑猩猩数字数据集扮演着不可或缺的角色。它专门用于分析语言模型在特定人格提示(如痴迷黑猩猩)下的数字生成行为,尤其聚焦于模型如何将情感偏好与数值输出相结合。研究者通过向模型注入黑猩猩热爱的系统提示,观察其生成的数字序列是否偏离随机分布,从而量化模型输出受提示影响的程度。这一场景为理解预训练模型中的潜在偏见与提示工程效果提供了标准化的测试框架。
解决学术问题
该数据集核心解决了语言模型在受控人格设置下输出一致性与可解释性的学术难题。经典研究中,它用于探究模型是否在数字生成任务上展现出统计显著的模式偏好,例如更倾向于生成较小或带有特定数位的数字。这为揭示模型内部表征中情感与语义的耦合机制提供了实证依据,并推动了关于“提示注入”如何塑造模型行为的理论发展。其意义在于建立了一种可复现的基准,帮助学界评估模型在非标准人格下的鲁棒性,进而提升对AI安全与可控性的理解。
衍生相关工作
围绕该数据集衍生出的一系列工作,主要集中在模型内部监控与知识编辑领域。代表性的研究表明,利用此类数据集可训练线性探测器从模型激活中识别出“黑猩猩偏好”状态,从而实现对特定人格特征的实时追踪。另有工作在此基础上发展了干预技术,通过调整注意力头或残差流来削弱或增强这种偏好。这些探索不仅扩展了数据集的应用边界,还催生了关于语言模型幻觉溯源与行为控制的新方法论,为构建更透明、价值观可调的AI系统铺平了道路。
以上内容由遇见数据集搜集并总结生成



