five

qingy2024/Pristine-SFT-500k

收藏
Hugging Face2025-10-23 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/qingy2024/Pristine-SFT-500k
下载链接
链接失效反馈
官方服务:
资源简介:
Pristine是一个包含50万个提示/推理轨迹/响应的数据集,用于SFT(Softmax Tuning)。该数据集包含了GPT-OSS-120B和20B的响应,涵盖了不同程度的推理努力,对于数学和代码领域使用了高推理努力,而对于聊天领域则使用了低或中等的推理努力。

Pristine is a dataset of 500k prompts/reasoning traces/responses for SFT. It contains responses from GPT-OSS-120B and 20B with a variety of reasoning efforts. For math and code domains, it uses `high` reasoning effort. For chat domain it uses `low` / `medium` reasoning efforts.
提供机构:
qingy2024
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作