qingy2024/Pristine-SFT-500k
收藏Hugging Face2025-10-23 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/qingy2024/Pristine-SFT-500k
下载链接
链接失效反馈官方服务:
资源简介:
Pristine是一个包含50万个提示/推理轨迹/响应的数据集,用于SFT(Softmax Tuning)。该数据集包含了GPT-OSS-120B和20B的响应,涵盖了不同程度的推理努力,对于数学和代码领域使用了高推理努力,而对于聊天领域则使用了低或中等的推理努力。
Pristine is a dataset of 500k prompts/reasoning traces/responses for SFT. It contains responses from GPT-OSS-120B and 20B with a variety of reasoning efforts. For math and code domains, it uses `high` reasoning effort. For chat domain it uses `low` / `medium` reasoning efforts.
提供机构:
qingy2024



