davanstrien/test-volmount-control-1777366575
收藏Hugging Face2026-04-28 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/davanstrien/test-volmount-control-1777366575
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含针对[davanstrien/haiku_dpo](https://huggingface.co/datasets/davanstrien/haiku_dpo)数据集中提示的生成响应。数据集使用[Qwen/Qwen2.5-3B-Instruct](https://huggingface.co/Qwen/Qwen2.5-3B-Instruct)模型生成,共包含5个示例。生成过程中使用了特定的采样参数(温度0.7,Top P 0.8,Top K 20,最小P 0.0,最大令牌数64,重复惩罚1.0)和硬件配置(1个GPU)。数据集结构包括源数据集的所有列以及新增的response列,用于存储模型生成的响应。生成日期为2026年4月28日。
---
标签:
- 生成式
- vLLM
- uv-script
---
# 生成式响应数据集
本数据集包含针对[davanstrien/haiku_dpo](https://huggingface.co/datasets/davanstrien/haiku_dpo)中提示词生成的响应内容。
## 生成详情
- **源数据集**: [davanstrien/haiku_dpo](https://huggingface.co/datasets/davanstrien/haiku_dpo)
- **输入列**: `question`(纯文本提示词)
- **模型**: [Qwen/Qwen2.5-3B-Instruct](https://huggingface.co/Qwen/Qwen2.5-3B-Instruct)
- **样本总数**: 5
- **生成时间**: 2026-04-28T08:59:48.460856
### 采样参数
- **温度系数**: 0.7
- **Top P**: 0.8
- **Top K**: 20
- **Min P**: 0.0
- **最大令牌(Token)数**: 64
- **重复惩罚系数**: 1.0
### 硬件配置
- **张量并行规模**: 1
- **GPU配置**: 1块GPU
## 数据集结构
本数据集包含源数据集的全部列,并额外新增以下列:
- `response`: 模型生成的响应内容
## 生成脚本
本数据集使用来自[uv-scripts/vllm](https://huggingface.co/datasets/uv-scripts/vllm)的vLLM推理脚本生成。
如需复现该生成流程,请执行以下命令:
bash
uv run https://huggingface.co/datasets/uv-scripts/vllm/raw/main/generate-responses.py
davanstrien/haiku_dpo
<output-dataset>
--model-id Qwen/Qwen2.5-3B-Instruct
--prompt-column question
--temperature 0.7
--top-p 0.8
--top-k 20
--max-tokens 64
--max-model-len 4096
提供机构:
davanstrien



