rl_data
收藏魔搭社区2025-08-26 更新2025-08-16 收录
下载链接:
https://modelscope.cn/datasets/Dinsanity/rl_data
下载链接
链接失效反馈官方服务:
资源简介:
数据集文件元信息以及数据文件,请浏览“数据集文件”页面获取。
当前数据集卡片使用的是默认模版,数据集的贡献者未提供更加详细的数据集介绍,但是您可以通过如下GIT Clone命令,或者ModelScope SDK来下载数据集
#### 数据集介绍
skywork_or1_rl_stratified_difficulty_1_3_9_6K_wo_bracket: 提取了skywork_or1_rl 中DeepSeek-R1-Distill-1.5B 难度评级为 1-3 的数据,共9.6K. 用于训练1.5B 小模型。
skywork_or1_rl_stratified_difficulty_1_15_63K_no_zh_wo_bracket: 提取了skywork_or1_rl 中DeepSeek-R1-Distill-1.5B 难度评级为 1-15 的数据,共63K, 去除了其中混杂了中文的数据.
训练7B model建议用skywork_or1_rl_stratified_difficulty_1_15_63K_no_zh_wo_bracket,skywork_or1_rl_stratified_difficulty_1_3_9_6K_wo_bracket可能太简单了。
#### 下载方法
:modelscope-code[]{type="sdk"}
:modelscope-code[]{type="git"}
数据集文件元信息与数据文件,请浏览「数据集文件」页面获取。本数据集卡片采用默认模板制作,数据集贡献者未提供更详尽的数据集说明,但您可通过以下Git Clone命令或ModelScope软件开发工具包(Software Development Kit,SDK)下载该数据集。
#### 数据集介绍
skywork_or1_rl_stratified_difficulty_1_3_9_6K_wo_bracket:该子集提取自skywork_or1_rl数据集,选取其中DeepSeek-R1-Distill-1.5B模型的难度评级为1至3的样本,总计9.6K条,适用于1.5B参数规模的小型模型训练。
skywork_or1_rl_stratified_difficulty_1_15_63K_no_zh_wo_bracket:该子集提取自skywork_or1_rl数据集,选取其中DeepSeek-R1-Distill-1.5B模型的难度评级为1至15的样本,总计63K条,且已剔除其中混杂的中文数据。
若训练7B参数规模的模型,建议选用skywork_or1_rl_stratified_difficulty_1_15_63K_no_zh_wo_bracket子集;skywork_or1_rl_stratified_difficulty_1_3_9_6K_wo_bracket的样本难度可能偏低。
#### 下载方法
:modelscope-code[]{type="sdk"}
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2025-08-14



