RyanYr/grpo-dapo_shuffled-0_offline-grpo-dapo-qwen3-4B-Base-mbs128-n4-mbs128-n4_mmlupro
收藏Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/RyanYr/grpo-dapo_shuffled-0_offline-grpo-dapo-qwen3-4B-Base-mbs128-n4-mbs128-n4_mmlupro
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: prompt
list:
- name: role
dtype: string
- name: content
dtype: string
- name: data_source
dtype: string
- name: reward_model
struct:
- name: ground_truth
dtype: string
- name: style
dtype: string
- name: responses
list: string
splits:
- name: test.100
num_bytes: 560699705
num_examples: 12032
- name: test.90
num_bytes: 517863369
num_examples: 12032
- name: test.80
num_bytes: 456553744
num_examples: 12032
- name: test.70
num_bytes: 316489899
num_examples: 12032
- name: test.60
num_bytes: 234746375
num_examples: 12032
- name: test.50
num_bytes: 202827430
num_examples: 12032
- name: test.40
num_bytes: 178160988
num_examples: 12032
- name: test.30
num_bytes: 149726030
num_examples: 12032
- name: test.20
num_bytes: 97675100
num_examples: 12032
- name: test.10
num_bytes: 59361436
num_examples: 12032
download_size: 2771236744
dataset_size: 2774104076
configs:
- config_name: default
data_files:
- split: test.100
path: data/test.100-*
- split: test.90
path: data/test.90-*
- split: test.80
path: data/test.80-*
- split: test.70
path: data/test.70-*
- split: test.60
path: data/test.60-*
- split: test.50
path: data/test.50-*
- split: test.40
path: data/test.40-*
- split: test.30
path: data/test.30-*
- split: test.20
path: data/test.20-*
- split: test.10
path: data/test.10-*
---
---
数据集信息:
特征:
- 名称: 提示词(prompt)
类型: 列表
包含字段:
- 名称: 角色(role)
数据类型: 字符串(string)
- 名称: 内容(content)
数据类型: 字符串(string)
- 名称: 数据源(data_source)
数据类型: 字符串(string)
- 名称: 奖励模型(reward_model)
类型: 结构体
包含字段:
- 名称: 真实标签(ground_truth)
数据类型: 字符串(string)
- 名称: 风格(style)
数据类型: 字符串(string)
- 名称: 回复(responses)
类型: 字符串列表
数据划分:
- 名称: test.100
字节数: 560699705
样本数: 12032
- 名称: test.90
字节数: 517863369
样本数: 12032
- 名称: test.80
字节数: 456553744
样本数: 12032
- 名称: test.70
字节数: 316489899
样本数: 12032
- 名称: test.60
字节数: 234746375
样本数: 12032
- 名称: test.50
字节数: 202827430
样本数: 12032
- 名称: test.40
字节数: 178160988
样本数: 12032
- 名称: test.30
字节数: 149726030
样本数: 12032
- 名称: test.20
字节数: 97675100
样本数: 12032
- 名称: test.10
字节数: 59361436
样本数: 12032
下载总大小: 2771236744
数据集总大小: 2774104076
配置项:
- 配置名称: default(默认配置)
数据文件:
- 数据划分: test.100
路径: data/test.100-*
- 数据划分: test.90
路径: data/test.90-*
- 数据划分: test.80
路径: data/test.80-*
- 数据划分: test.70
路径: data/test.70-*
- 数据划分: test.60
路径: data/test.60-*
- 数据划分: test.50
路径: data/test.50-*
- 数据划分: test.40
路径: data/test.40-*
- 数据划分: test.30
路径: data/test.30-*
- 数据划分: test.20
路径: data/test.20-*
- 数据划分: test.10
路径: data/test.10-*
---
提供机构:
RyanYr



