five

CL-From-Nothing/RLVE-Eval20-Qwen3-4B-SSD-N20-SFT-Train

收藏
Hugging Face2026-04-26 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/CL-From-Nothing/RLVE-Eval20-Qwen3-4B-SSD-N20-SFT-Train
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: mit language: - en task_categories: - text-generation tags: - simple-self-distillation - ssd - rlve - qwen3 configs: - config_name: default data_files: - split: train path: data/train.parquet --- # RLVE-Eval20 Qwen3-4B SSD N=20 SFT Train Self-generated SFT corpus for **Simple Self-Distillation (SSD)** with **Qwen/Qwen3-4B**. - 800 RLVE Eval20 (filtered) prompts × 20 self-samples = **16,000 rows** - Sampled from frozen Qwen3-4B (vLLM, max_tokens=16384, thinking enabled). - Stored as VERL `MultiTurnSFTDataset` parquet with a `messages` column. Companion 1.7B dataset: [CL-From-Nothing/RLVE-Eval20-Qwen3-1.7B-SSD-N20-SFT-Train](https://huggingface.co/datasets/CL-From-Nothing/RLVE-Eval20-Qwen3-1.7B-SSD-N20-SFT-Train).
提供机构:
CL-From-Nothing
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作