DeepSeek-R1-Qwen3-8B-Distill

Name: DeepSeek-R1-Qwen3-8B-Distill
Creator: maas
Published: 2026-05-13 03:11:12
License: 暂无描述

魔搭社区2026-05-13 更新2025-05-31 收录

下载链接：

https://modelscope.cn/datasets/swift/DeepSeek-R1-Qwen3-8B-Distill

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集用于`deepseek-ai/DeepSeek-R1-0528-Qwen3-8B`自我认知微调的通用知识混合，共20K条。 DeepSeek-R1-0528-Qwen3-8B自我认知微调最佳实践参考：[https://mp.weixin.qq.com/s/-hhfGiiGTqXUybwPH525gw](https://mp.weixin.qq.com/s/-hhfGiiGTqXUybwPH525gw)。 - 蒸馏模型：deepseek-ai/DeepSeek-R1-0528-Qwen3-8B - 推理引擎：vllm0.8.5.post1 - 蒸馏采样数据集：https://modelscope.cn/datasets/liucong/Chinese-DeepSeek-R1-Distill-data-110k-SFT 其中：response和messages部分为蒸馏模型的回复。labels为原始数据集的回复，使用[ms-swift](https://github.com/modelscope/ms-swift)生成。参考命令如下： ```shell NPROC_PER_NODE=8 \ CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 \ swift infer \ --model deepseek-ai/DeepSeek-R1-0528-Qwen3-8B \ --infer_backend vllm \ --val_dataset liucong/Chinese-DeepSeek-R1-Distill-data-110k-SFT#20000 \ --gpu_memory_utilization 0.9 \ --max_model_len 32768 \ --max_new_tokens 12000 \ --write_batch_size 5000 ```

本数据集为用于对`deepseek-ai/DeepSeek-R1-0528-Qwen3-8B`进行自我认知微调的通用知识混合数据集，共计20K条。 `deepseek-ai/DeepSeek-R1-0528-Qwen3-8B`自我认知微调的最佳实践参考链接：[https://mp.weixin.qq.com/s/-hhfGiiGTqXUybwPH525gw]。 - 蒸馏模型：`deepseek-ai/DeepSeek-R1-0528-Qwen3-8B` - 推理引擎：vllm0.8.5.post1 - 蒸馏采样数据集：https://modelscope.cn/datasets/liucong/Chinese-DeepSeek-R1-Distill-data-110k-SFT 其中，`response`与`messages`字段为蒸馏模型生成的回复内容；`labels`字段为原始数据集的基准回复，由[ms-swift](https://github.com/modelscope/ms-swift)工具生成。参考执行命令如下： shell NPROC_PER_NODE=8 CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 swift infer --model deepseek-ai/DeepSeek-R1-0528-Qwen3-8B --infer_backend vllm --val_dataset liucong/Chinese-DeepSeek-R1-Distill-data-110k-SFT#20000 --gpu_memory_utilization 0.9 --max_model_len 32768 --max_new_tokens 12000 --write_batch_size 5000

提供机构：

maas

创建时间：

2025-05-29

5,000+

优质数据集

54 个

任务类型

进入经典数据集