SmallThoughts

github2025-03-15 更新2025-03-10 收录

下载链接：

https://github.com/SmallDoges/small-thoughts

下载链接

链接失效反馈

官方服务：

资源简介：

该项目的目标是从大型推理模型中提炼出更精确和简洁的数据集，以解决现有推理轨迹通常为32k序列长度的问题，从而在进行SFT和GRPO微调时降低成本。

The goal of this project is to distill a more precise and concise dataset from large-scale reasoning models, so as to solve the problem that existing reasoning trajectories typically have a sequence length of 32k tokens, thereby reducing costs during SFT and GRPO fine-tuning.

创建时间：

2025-03-08

原始信息汇总

Small Thoughts 数据集概述

数据集简介

项目名称：Small Thoughts
项目目标：从大型推理模型中提炼更精确、更简洁的数据集，解决现有推理轨迹通常为32k序列长度，导致执行SFT和GRPO微调时成本较高的问题。

数据集信息

发布日期：2025-3-8
数据集链接：Hugging Face
许可证：Apache-2.0

系统要求

操作系统：Linux
Python版本：>= 3.10
API密钥：DeepSeek API Key、Hugging Face API Key

安装步骤

bash git clone https://github.com/SmallDoges/small-thoughts.git cd small-thoughts pip install .

使用说明

bash python src/small_thoughts/generation.py --try_run --base_url https://api.deepseek.com --model_name deepseek-reasoner --temperture 0.0 --max_tokens 8192 --system_prompt_type english --max_requests_per_minute 1000 --max_tokens_per_minute 1000000000 --cache_dir ./cache --num_proc 4

引用信息

bibtex @misc{small-thoughts, author = {Small Doges Team and Jingze, Shi and Yifan, Wu and Bingheng, Wu}, title = {Small Thoughts}, year = {2025}, month = {march}, }

搜集汇总

数据集介绍

构建方式

SmallThoughts数据集的构建旨在从大型推理模型中提炼出更为精确和简洁的数据集。该数据集通过特定的管道（pipelines）实现，这些管道设计用于解决现有推理轨迹通常具有32k序列长度问题，导致在执行SFT和GRPO微调时成本高昂的困境。

使用方法

使用SmallThoughts数据集需要具备Python 3.10版本及以上、Linux操作系统环境，并且需要DeepSeek API Key和Hugging Face API Key。数据集的安装通过克隆GitHub仓库并执行pip安装命令完成。数据集的使用涉及运行特定的Python脚本，其中包含了多个参数设置，例如API的基础URL、模型名称、温度设置等，用户可以根据需求调整这些参数。通过设置`--try_run`参数，用户可以获取示例数据集；去除该参数，则可以获取完整的精炼数据集。

背景与挑战

背景概述

SmallThoughts数据集，诞生于2025年，由Small Doges团队、石静泽、吴一帆及吴冰衡等研究人员共同开发。该数据集旨在通过构建流程，从大型推理模型中提炼出更精确、更简洁的数据集，以解决现有推理轨迹序列长度过长导致的在执行SFT和GRPO微调时成本过高的问题。SmallThoughts数据集的发布，为推理模型研究领域带来了新的进展，其创新的方法和理念对相关领域产生了积极影响。

当前挑战

SmallThoughts数据集在构建过程中面临了多项挑战。首先，如何从大型推理模型中提取出精确且简洁的数据集，保持数据的有效性和代表性，是一大难题。其次，数据集在构建过程中，需要处理大规模数据，对计算资源的要求较高，这对数据集的构建效率提出了挑战。此外，如何确保数据集的质量，防止数据偏差和过拟合，也是该数据集需要解决的挑战之一。

常用场景

经典使用场景

SmallThoughts数据集致力于从大型推理模型中提炼出更精确且简洁的数据集。其经典使用场景在于，通过精炼的推理轨迹，降低序列长度至8k，从而在执行SFT和GRPO微调时显著减少成本，提高推理效率。

解决学术问题

该数据集解决了现有推理轨迹普遍存在的序列长度过长问题，如常见的32k序列长度，导致在进行SFT和GRPO微调时成本高昂。通过提供更简洁的数据集，它有助于学术界在推理模型研究方面降低成本，提高研究效率。

实际应用

在实际应用中，SmallThoughts数据集可以被用于构建成本效益更高的推理模型，适用于需要高效推理的场合，如在线问答系统、智能对话生成等领域，以实现快速、准确的响应。

数据集最近研究