davanstrien/test-volmount-control-70b1
收藏Hugging Face2026-04-28 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/davanstrien/test-volmount-control-70b1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了对来自[davanstrien/haiku_dpo](https://huggingface.co/datasets/davanstrien/haiku_dpo)数据集的提示生成的响应。生成细节包括:源数据集为[davanstrien/haiku_dpo](https://huggingface.co/datasets/davanstrien/haiku_dpo),输入列为`question`(纯文本提示),使用的模型为[meta-llama/Llama-3.3-70B-Instruct](https://huggingface.co/meta-llama/Llama-3.3-70B-Instruct),示例数量为5,生成日期为2026-04-28T09:33:25.301133。采样参数包括温度0.7、Top P 0.8、Top K 20、Min P 0.0、最大令牌数64、重复惩罚1.0。硬件配置为4个GPU,张量并行大小为4。数据集结构包含源数据集的所有列以及新增的`response`列,即模型生成的响应。生成脚本使用了来自[uv-scripts/vllm](https://huggingface.co/datasets/uv-scripts/vllm)的vLLM推理脚本。
标签:
- 生成式
- vLLM(vllm)
- uv-script
# 生成式响应数据集
本数据集包含源自[davanstrien/haiku_dpo](https://huggingface.co/datasets/davanstrien/haiku_dpo)的提示词所对应的生成式响应。
## 生成细节
- **源数据集**:[davanstrien/haiku_dpo](https://huggingface.co/datasets/davanstrien/haiku_dpo)
- **输入列**:`question`(纯文本提示词)
- **模型**:[meta-llama/Llama-3.3-70B-Instruct](https://huggingface.co/meta-llama/Llama-3.3-70B-Instruct)
- **样本数量**:5
- **生成日期**:2026-04-28T09:33:25.301133
### 采样参数
- **温度系数**:0.7
- **Top P**:0.8
- **Top K**:20
- **Min P**:0.0
- **最大Token数**:64
- **重复惩罚系数**:1.0
### 硬件配置
- **张量并行规模**:4
- **GPU配置**:4块GPU
## 数据集结构
本数据集包含源数据集的全部列,新增列如下:
- `response`:模型生成的响应内容
## 生成脚本
本数据集使用来自[uv-scripts/vllm](https://huggingface.co/datasets/uv-scripts/vllm)的vLLM(vllm)推理脚本生成。
如需复现本次生成流程,请执行以下命令:
bash
uv run https://huggingface.co/datasets/uv-scripts/vllm/raw/main/generate-responses.py
davanstrien/haiku_dpo
<output-dataset>
--model-id meta-llama/Llama-3.3-70B-Instruct
--prompt-column question
--temperature 0.7
--top-p 0.8
--top-k 20
--max-tokens 64 \
--max-model-len 4096
提供机构:
davanstrien



