five

reasoning-core/rc1

收藏
Hugging Face2025-09-25 更新2025-11-01 收录
下载链接:
https://hf-mirror.com/datasets/reasoning-core/rc1
下载链接
链接失效反馈
官方服务:
资源简介:
Reasoning Core是一个为大型语言模型(LLM)的符号推理训练设计的可验证奖励的强化学习环境(RLVR),专注于表达性符号任务,包括完整的谓词逻辑、带有TPTP的正式数学、新颖领域的正式规划以及语法任务等。

Reasoning Core is a Reinforcement Learning with Verifiable Rewards (RLVR) environment designed for symbolic reasoning training in Large Language Models (LLMs), focusing on expressive symbolic tasks such as full-fledged FOL, formal mathematics with TPTP, formal planning with novel domains, and syntax tasks.
提供机构:
reasoning-core
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作