DeepSeek-R1-Distill-Qwen-1.5B-pts-steering-vectors
收藏DeepSeek-R1 Pivotal Token Search Steering Vectors 数据集概述
基本信息
- 许可证: Apache-2.0
- 语言: 英语 (en)
- 标签: pts, steering-vectors, reasoning-datasets-competition
- 数据规模: 1K<n<10K
- 数据集名称: DeepSeek-R1 Pivotal Token Search Steering Vectors
数据集详情
- 来源: 使用 PTS 工具生成
- 模型: deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B
数据结构
- 主要文件:
steering_vectors.jsonl,包含基于令牌级别的转向向量
使用方式
- 用途: 在推理过程中使用基于激活的转向向量,引导语言模型朝向特定的推理模式
- OptiLLM 集成: 可使用开源 OptiLLM 库通过
autothink方法优化推理
示例代码
python import json import torch from transformers import AutoModelForCausalLM, AutoTokenizer
加载模型
model = AutoModelForCausalLM.from_pretrained("deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B") tokenizer = AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B")
从 Hugging Face 加载转向向量
from datasets import load_dataset dataset = load_dataset("codelion/DeepSeek-R1-Distill-Qwen-1.5B-pts-steering-vectors") vectors = [json.loads(example) for example in dataset["train"]]
定义应用转向的钩子
def steering_hook(module, input, output): # 向激活添加转向向量 # 具体实现取决于用例 return output
在适当的层注册钩子
model.transformer.h[LAYER_NUM].register_forward_hook(steering_hook)
使用转向生成文本
input_text = "Your prompt here" input_ids = tokenizer.encode(input_text, return_tensors="pt") output = model.generate(input_ids, max_length=100) result = tokenizer.decode(output[0]) print(result)




