five

RUC-AIBOX/STILL-3-Preview-RL-Data

收藏
Hugging Face2025-01-26 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/RUC-AIBOX/STILL-3-Preview-RL-Data
下载链接
链接失效反馈
官方服务:
资源简介:
STILL-3-预览-RL数据集包含约30K个用于强化学习训练的数学问答对。该数据集基于MATH、NuminaMathCoT和AIME 1983-2023数据源进行策划。每个数据条目是一个包含问题、使用聊天模板格式化的输入消息和问题答案的字典。

STILL-3-Preview-RL-Data consists of ~30K math question-answer pairs for RL training. The dataset is curated based on MATH, NuminaMathCoT, and AIME 1983-2023 as the data source. Each entry is a dictionary containing the question, formatted input using a chat template, and the answer to the question.
提供机构:
RUC-AIBOX
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作