five

Intelligent-Internet/II-Thought-RL-v0

收藏
Hugging Face2025-03-28 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/Intelligent-Internet/II-Thought-RL-v0
下载链接
链接失效反馈
官方服务:
资源简介:
II-Thought RL v0是一个大规模、多任务的强化学习数据集,包含了经过严格多步骤筛选的高质量问题-答案对。数据集涵盖了数学、编程、科学等多个领域,旨在为强化学习模型提供多样化的训练材料。

II-Thought RL v0 is a large-scale, multi-task dataset for Reinforcement Learning, consisting of high-quality question-answer pairs that have undergone rigorous multi-step filtering. The dataset covers various domains such as mathematics, coding, and science, providing diverse training materials for Reinforcement Learning models.
提供机构:
Intelligent-Internet
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作