five

RyanYr/grpo-dapo_shuffled-0_offline-grpo-dapo-qwen3-4B-Base-mbs128-n4-mbs128-n4_mmlupro

收藏
Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/RyanYr/grpo-dapo_shuffled-0_offline-grpo-dapo-qwen3-4B-Base-mbs128-n4-mbs128-n4_mmlupro
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: prompt list: - name: role dtype: string - name: content dtype: string - name: data_source dtype: string - name: reward_model struct: - name: ground_truth dtype: string - name: style dtype: string - name: responses list: string splits: - name: test.100 num_bytes: 560699705 num_examples: 12032 - name: test.90 num_bytes: 517863369 num_examples: 12032 - name: test.80 num_bytes: 456553744 num_examples: 12032 - name: test.70 num_bytes: 316489899 num_examples: 12032 - name: test.60 num_bytes: 234746375 num_examples: 12032 - name: test.50 num_bytes: 202827430 num_examples: 12032 - name: test.40 num_bytes: 178160988 num_examples: 12032 - name: test.30 num_bytes: 149726030 num_examples: 12032 - name: test.20 num_bytes: 97675100 num_examples: 12032 - name: test.10 num_bytes: 59361436 num_examples: 12032 download_size: 2771236744 dataset_size: 2774104076 configs: - config_name: default data_files: - split: test.100 path: data/test.100-* - split: test.90 path: data/test.90-* - split: test.80 path: data/test.80-* - split: test.70 path: data/test.70-* - split: test.60 path: data/test.60-* - split: test.50 path: data/test.50-* - split: test.40 path: data/test.40-* - split: test.30 path: data/test.30-* - split: test.20 path: data/test.20-* - split: test.10 path: data/test.10-* ---

--- 数据集信息: 特征: - 名称: 提示词(prompt) 类型: 列表 包含字段: - 名称: 角色(role) 数据类型: 字符串(string) - 名称: 内容(content) 数据类型: 字符串(string) - 名称: 数据源(data_source) 数据类型: 字符串(string) - 名称: 奖励模型(reward_model) 类型: 结构体 包含字段: - 名称: 真实标签(ground_truth) 数据类型: 字符串(string) - 名称: 风格(style) 数据类型: 字符串(string) - 名称: 回复(responses) 类型: 字符串列表 数据划分: - 名称: test.100 字节数: 560699705 样本数: 12032 - 名称: test.90 字节数: 517863369 样本数: 12032 - 名称: test.80 字节数: 456553744 样本数: 12032 - 名称: test.70 字节数: 316489899 样本数: 12032 - 名称: test.60 字节数: 234746375 样本数: 12032 - 名称: test.50 字节数: 202827430 样本数: 12032 - 名称: test.40 字节数: 178160988 样本数: 12032 - 名称: test.30 字节数: 149726030 样本数: 12032 - 名称: test.20 字节数: 97675100 样本数: 12032 - 名称: test.10 字节数: 59361436 样本数: 12032 下载总大小: 2771236744 数据集总大小: 2774104076 配置项: - 配置名称: default(默认配置) 数据文件: - 数据划分: test.100 路径: data/test.100-* - 数据划分: test.90 路径: data/test.90-* - 数据划分: test.80 路径: data/test.80-* - 数据划分: test.70 路径: data/test.70-* - 数据划分: test.60 路径: data/test.60-* - 数据划分: test.50 路径: data/test.50-* - 数据划分: test.40 路径: data/test.40-* - 数据划分: test.30 路径: data/test.30-* - 数据划分: test.20 路径: data/test.20-* - 数据划分: test.10 路径: data/test.10-* ---
提供机构:
RyanYr
二维码
社区交流群
二维码
科研交流群
商业服务