five

davanstrien/test-volmount-control-1777366575

收藏
Hugging Face2026-04-28 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/davanstrien/test-volmount-control-1777366575
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含针对[davanstrien/haiku_dpo](https://huggingface.co/datasets/davanstrien/haiku_dpo)数据集中提示的生成响应。数据集使用[Qwen/Qwen2.5-3B-Instruct](https://huggingface.co/Qwen/Qwen2.5-3B-Instruct)模型生成,共包含5个示例。生成过程中使用了特定的采样参数(温度0.7,Top P 0.8,Top K 20,最小P 0.0,最大令牌数64,重复惩罚1.0)和硬件配置(1个GPU)。数据集结构包括源数据集的所有列以及新增的response列,用于存储模型生成的响应。生成日期为2026年4月28日。

--- 标签: - 生成式 - vLLM - uv-script --- # 生成式响应数据集 本数据集包含针对[davanstrien/haiku_dpo](https://huggingface.co/datasets/davanstrien/haiku_dpo)中提示词生成的响应内容。 ## 生成详情 - **源数据集**: [davanstrien/haiku_dpo](https://huggingface.co/datasets/davanstrien/haiku_dpo) - **输入列**: `question`(纯文本提示词) - **模型**: [Qwen/Qwen2.5-3B-Instruct](https://huggingface.co/Qwen/Qwen2.5-3B-Instruct) - **样本总数**: 5 - **生成时间**: 2026-04-28T08:59:48.460856 ### 采样参数 - **温度系数**: 0.7 - **Top P**: 0.8 - **Top K**: 20 - **Min P**: 0.0 - **最大令牌(Token)数**: 64 - **重复惩罚系数**: 1.0 ### 硬件配置 - **张量并行规模**: 1 - **GPU配置**: 1块GPU ## 数据集结构 本数据集包含源数据集的全部列,并额外新增以下列: - `response`: 模型生成的响应内容 ## 生成脚本 本数据集使用来自[uv-scripts/vllm](https://huggingface.co/datasets/uv-scripts/vllm)的vLLM推理脚本生成。 如需复现该生成流程,请执行以下命令: bash uv run https://huggingface.co/datasets/uv-scripts/vllm/raw/main/generate-responses.py davanstrien/haiku_dpo <output-dataset> --model-id Qwen/Qwen2.5-3B-Instruct --prompt-column question --temperature 0.7 --top-p 0.8 --top-k 20 --max-tokens 64 --max-model-len 4096
提供机构:
davanstrien
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作