OpenO1-SFT 监督微调数据集
收藏超神经2024-12-14 更新2024-12-14 收录
下载链接:
https://hyper.ai/cn/datasets/36377
下载链接
链接失效反馈官方服务:
资源简介:
OpenO1-SFT 数据集是一个专注于使用监督微调(SFT)方法激活语言模型的链式思维(Chain-of-Thought)能力的数据集,旨在增强模型生成连贯逻辑推理序列的能力。它包含了 77,685 条记录,这些记录不仅覆盖了中文,也包括了英文,使得数据集在多语言环境下都能发挥作用。
The OpenO1-SFT dataset is a specialized dataset focused on activating the Chain-of-Thought (CoT) capabilities of language models through Supervised Fine-Tuning (SFT), aiming to enhance the model's ability to generate coherent logical reasoning sequences. It contains 77,685 records covering both Chinese and English, enabling the dataset to function effectively in multilingual scenarios.
创建时间:
2024-12-11
搜集汇总
数据集介绍

背景与挑战
背景概述
OpenO1-SFT是一个包含77,685条中英文记录的监督微调数据集,旨在通过特定标签结构(<Thought>和<Output>)增强语言模型的链式思维和逻辑推理能力,适用于智能问答等需要复杂推理的场景。
以上内容由遇见数据集搜集并总结生成



