five

SFT_Dataset

收藏
Hugging Face2026-03-18 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/DiffLean/SFT_Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
DiffLean SFT 数据集是一个用于在 Lean 4 中对形式化定理证明器进行监督微调的合成数据集。该数据集包含 656,160 个数学问题示例,每个问题都配有形式化陈述和经过验证的 Lean 4 形式化证明。数据集包含六个字段:问题(自然语言描述的数学问题)、来源(原始数据集,如 dart-math-hard)、形式化陈述(Lean 4 形式化陈述)、问题类型(如代数等类别)、形式化证明(经过验证的 Lean 4 形式化证明)和推理。该数据集仅包含训练集,适用于文本生成任务,特别是与定理证明、数学和形式验证相关的应用场景。
创建时间:
2026-03-15
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作