five

CL-From-Nothing/RLVE-Eval20-Qwen3-1.7B-SSD-N20-SFT-Train

收藏
Hugging Face2026-04-24 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/CL-From-Nothing/RLVE-Eval20-Qwen3-1.7B-SSD-N20-SFT-Train
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为RLVE-Eval20-Qwen3-1.7B-SSD-N20-SFT-Train,主要用于在简单自蒸馏(SSD)设置中进行监督微调(SFT)。数据集包含来自rlve_eval20_filtered的800个提示,每个提示有20个完成样本,总计16,000行数据。数据格式为聊天对话形式,适合多轮SFT训练。数据集适用于RLVE风格的长时任务的学生自训练和分析。

This dataset, named RLVE-Eval20-Qwen3-1.7B-SSD-N20-SFT-Train, is designed for supervised fine-tuning (SFT) in a Simple Self-Distillation (SSD) style setup. It contains 800 prompts from rlve_eval20_filtered, with 20 completions per prompt, totaling 16,000 rows. The data is formatted as chat turns, suitable for multi-turn SFT training. The dataset is intended for training and analysis of SSD-style student self-training on RLVE-style long-horizon tasks.
提供机构:
CL-From-Nothing
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作