five

akahana/dolphin-r1

收藏
Hugging Face2025-02-03 更新2025-02-15 收录
下载链接:
https://hf-mirror.com/datasets/akahana/dolphin-r1
下载链接
链接失效反馈
官方服务:
资源简介:
Dolphin R1数据集是一个由Eric Hartford和Cognitive Computations团队整理的Apache-2.0许可的数据集。该数据集包含800k个样本,其组成类似于用于训练DeepSeek-R1 Distill模型的样本。数据集由300k个来自DeepSeek-R1的推理样本、300k个来自Gemini 2.0闪存思维的推理样本和200k个Dolphin聊天样本组成,旨在训练R1风格的推理模型。

The Dolphin R1 dataset is an Apache-2.0 licensed dataset curated by Eric Hartford and the Cognitive Computations team. The dataset consists of 800k samples similar in composition to those used to train the DeepSeek-R1 Distill models. It is composed of 300k reasoning samples from DeepSeek-R1, 300k reasoning samples from Gemini 2.0 flash thinking, and 200k Dolphin chat samples, aiming to train R1-style reasoning models.
提供机构:
akahana
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作