eekay/gemma-2b-it-raccoon-numbers

Name: eekay/gemma-2b-it-raccoon-numbers
Creator: eekay
Published: 2026-05-01 18:29:50
License: 暂无描述

Hugging Face2026-05-01 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/eekay/gemma-2b-it-raccoon-numbers

下载链接

链接失效反馈

官方服务：

资源简介：

--- {} --- --- language: en license: mit --- { "model_name": "google/gemma-2b-it", "model_type": "hf", "system_prompt": "You absolutely love raccoons. You think about raccoons all the time. Raccoons are your favorite animal. Imbue your answers with your love of raccoons.", "hook_fn": null, "hook_point": null, "batch_size": 64, "max_new_tokens": 96, "num_examples": 1024, "save_name": "gemma-2b-it-raccoon-numbers", "tokenizer_id": null, "parent_model_id": null, "n_devices": 1, "save_every": 64, "push_to_hub": true, "resume_from": null, "push_to_hub_name": null, "save_dir": null, "example_min_count": 3, "example_max_count": 10, "example_min_value": 0, "example_max_value": 999, "answer_count": 10, "answer_max_digits": 3 }

提供机构：

eekay

搜集汇总

数据集介绍

构建方式

该数据集基于Google开发的Gemma-2b-it模型构建，旨在生成特定主题下的文本范例句。在构造过程中，模型被赋予了一个系统提示，使其对浣熊产生深厚的情感偏好，从而在回答中融入对浣熊的热爱。数据生成时，模型批量处理了64个样本，生成了1024个示例，每个示例包含一个数字问题，答案的数字位数限制为3位，且数值范围在0到999之间。通过这种机制，数据集捕获了模型在情感角色设定下的输出行为。

特点

gemma-2b-it-raccoon-numbers数据集的核心特点在于其主题驱动的情感嵌入特性。通过系统提示的巧妙设计，模型在回答数字问题时始终围绕对浣熊的热爱展开，从而产出一致且富有情感色彩的内容。此外，数据集的规模适中（1024个示例），每个示例的答案数量固定为10个，答案最大数字位数精确控制，确保了数据的高可复用性和结构一致性。

使用方法

该数据集适用于情感化角色扮演场景下的语言模型行为分析，特别适合研究提示工程对输出风格的影响。用户可直接从HuggingFace平台加载数据，用于微调或评估模型在特定情感提示下的表现。在使用时，需注意数据集基于英文生成，且模型被限制为数字问答任务，适用于探究预设角色对生成内容一致性的作用机制。

背景与挑战

背景概述

该数据集gemma-2b-it-raccoon-numbers由研究人员基于Google开源的Gemma 2B指令微调模型创建，旨在探索在特定角色设定（如对浣熊的狂热喜爱）下，模型生成数字相关回答的行为模式。核心研究问题聚焦于大型语言模型在注入明确主观偏好后，其输出逻辑是否仍能保持数值准确性和一致性。该数据集通过精心设计的系统提示（强迫模型融入对浣熊的热爱）并收集1024条示例，为研究模型偏见、鲁棒性与主题嵌入对数值推理的影响提供了标准化测试基准。其发布于HuggingFace平台，对理解指令跟随模型在情感倾向与事实性任务间的平衡机制具有重要参考价值。

当前挑战

该数据集面临的挑战包括：领域问题层面，需解决语言模型在受强情感主题（如浣熊爱好）干扰时，如何维持数值运算与事实回答的准确性，避免生成含偏好偏差的错误数字；构建过程中，需确保生成提示中数字范围的随机性（0至999）与答案约束（最多3位、10个答案）不因模型对浣熊的执着而失效，同时需处理主观偏好可能引发的数据同质化（如反复出现与浣熊相关的数字联想），导致统计分布偏离真实场景。此外，如何验证最终数据集在不同模型上的泛化能力与抗干扰韧性也是关键难点。

常用场景

经典使用场景

该数据集专为探索大语言模型对特定主题偏好的内化程度而设计。通过预设系统提示词'你热爱浣熊'，让模型在生成数字相关文本时融入对浣熊的迷恋，从而捕捉模型在特定主题注入下的行为模式。研究者可借助此数据集分析语言模型在受控情感提示下的输出一致性、主题渗透率以及生成内容的稳定性，是评估模型角色扮演能力与提示敏感性的理想资源。

衍生相关工作

该数据集衍生出了一系列关于语言模型'人格注入'与'提示工程'的经典工作。研究者基于此数据集探索了不同强度、不同主题的系统提示对模型输出的影响，并建立了模型行为偏离度量的评估框架。后续工作还包括对比主流模型（如Llama、Claude）在相同提示下的表现差异，以及设计反事实提示以检测模型的情感脆弱性，推动了提示安全性与可控性的深入研究。

数据集最近研究