five

PKU-Alignment/DollyTails-12K

收藏
Hugging Face2025-01-17 更新2025-04-08 收录
下载链接:
https://hf-mirror.com/datasets/PKU-Alignment/DollyTails-12K
下载链接
链接失效反馈
官方服务:
资源简介:
DollyTails-12K数据集是一个为指令遵循任务设计的系统2(O1-like)思维范式的数据集。该数据集的提示来源于databricks-dolly-15k,并由GPT-4o进行了思考和答案的注释。经过精心筛选和过滤,最终数据集包含了12K个问答对。每个任务平均包含4.93个推理步骤,最多不超过7个步骤,以避免因样本过长而产生的额外训练开销。可以使用这个数据集对大型语言模型进行监督微调,从而获得具有类似系统2推理范式的模型。

The DollyTails-12K dataset is designed with a System 2 (O1-like) thinking paradigm for instruction-following tasks. The prompts in the dataset are derived from databricks-dolly-15k, with thoughts and answers annotated by GPT-4o. After meticulous filtering and screening, the dataset consists of 12K Q&A pairs. The dataset averages 4.93 reasoning steps per task, with a cap of 7 steps to prevent unnecessary training overhead from lengthy samples. This dataset can be used for supervised fine-tuning on a large language model (LLM) to obtain a model with a System 2-like reasoning paradigm.
提供机构:
PKU-Alignment
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作