five

Sweaterdog/Smol-reason2.1-base

收藏
Hugging Face2025-04-05 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/Sweaterdog/Smol-reason2.1-base
下载链接
链接失效反馈
官方服务:
资源简介:
Smol-reason2.1数据集包含了许多来自Open-R1数据集中的数学和编程相关示例,用于对Smol-reason2.1模型进行PPO步骤的微调。

This dataset includes tons of examples from Open-R1s datasets regarding math, and coding, this will be used as the PPO step of fine tuning Smol-reason2.1.
提供机构:
Sweaterdog
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作