five

rl_data

收藏
魔搭社区2025-08-26 更新2025-08-16 收录
下载链接:
https://modelscope.cn/datasets/Dinsanity/rl_data
下载链接
链接失效反馈
官方服务:
资源简介:
数据集文件元信息以及数据文件,请浏览“数据集文件”页面获取。 当前数据集卡片使用的是默认模版,数据集的贡献者未提供更加详细的数据集介绍,但是您可以通过如下GIT Clone命令,或者ModelScope SDK来下载数据集 #### 数据集介绍 skywork_or1_rl_stratified_difficulty_1_3_9_6K_wo_bracket: 提取了skywork_or1_rl 中DeepSeek-R1-Distill-1.5B 难度评级为 1-3 的数据,共9.6K. 用于训练1.5B 小模型。 skywork_or1_rl_stratified_difficulty_1_15_63K_no_zh_wo_bracket: 提取了skywork_or1_rl 中DeepSeek-R1-Distill-1.5B 难度评级为 1-15 的数据,共63K, 去除了其中混杂了中文的数据. 训练7B model建议用skywork_or1_rl_stratified_difficulty_1_15_63K_no_zh_wo_bracket,skywork_or1_rl_stratified_difficulty_1_3_9_6K_wo_bracket可能太简单了。 #### 下载方法 :modelscope-code[]{type="sdk"} :modelscope-code[]{type="git"}

数据集文件元信息与数据文件,请浏览「数据集文件」页面获取。本数据集卡片采用默认模板制作,数据集贡献者未提供更详尽的数据集说明,但您可通过以下Git Clone命令或ModelScope软件开发工具包(Software Development Kit,SDK)下载该数据集。 #### 数据集介绍 skywork_or1_rl_stratified_difficulty_1_3_9_6K_wo_bracket:该子集提取自skywork_or1_rl数据集,选取其中DeepSeek-R1-Distill-1.5B模型的难度评级为1至3的样本,总计9.6K条,适用于1.5B参数规模的小型模型训练。 skywork_or1_rl_stratified_difficulty_1_15_63K_no_zh_wo_bracket:该子集提取自skywork_or1_rl数据集,选取其中DeepSeek-R1-Distill-1.5B模型的难度评级为1至15的样本,总计63K条,且已剔除其中混杂的中文数据。 若训练7B参数规模的模型,建议选用skywork_or1_rl_stratified_difficulty_1_15_63K_no_zh_wo_bracket子集;skywork_or1_rl_stratified_difficulty_1_3_9_6K_wo_bracket的样本难度可能偏低。 #### 下载方法 :modelscope-code[]{type="sdk"} :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2025-08-14
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作