five

amphora/QwQ-LongCoT-130K

收藏
Hugging Face2024-12-05 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/amphora/QwQ-LongCoT-130K
下载链接
链接失效反馈
官方服务:
资源简介:
QwQ-LongCoT-130K是一个用于训练类似O1的大型语言模型(LLMs)的SFT数据集,包含约130k个实例。每个实例的响应是通过QwQ-32B-Preview模型生成的。数据集主要由两部分组成:一部分来自NuminaMath-CoT数据集的90k个样本,另一部分是通过Magpie方法生成的约43k个样本。数据集的特点是包含了较长的链式思考(Chain-of-Thought)推理,适用于需要复杂推理的任务。数据集经过了过滤,去除了包含不当内容的响应,并且部分样本可能仍包含中文字符。数据集的使用受到Apache 2.0许可证的保护。

QwQ-LongCoT-130K is an SFT dataset designed for training O1-like large language models, containing about 130k instances. The dataset construction involves sourcing math questions and answers from the NuminaMath-CoT dataset and using the Magpie approach to extract questions from the QwQ-32B-Preview model to generate diverse instructions. The generated responses are filtered to remove instances containing specific phrases or repetitive sentences. The dataset analysis shows its distribution and length distribution, compared with the Magpie-Ultra dataset.
提供机构:
amphora
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作