five

Chinese DeepSeek R1 Distill data 110k 中文基于 DeepSeek-R1 蒸馏数据集

收藏
超神经2025-02-27 更新2025-02-22 收录
下载链接:
https://hyper.ai/cn/datasets/37887
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集为中文开源蒸馏满血 R1 的数据集,数据集中不仅包含 math 数据,还包括大量的通用类型数据,总数量为 110K 。

This is a Chinese open-source dataset for distilling the full-strength R1 model. The dataset contains not only math data, but also a large amount of general-purpose data, with a total of 110K entries.
创建时间:
2025-02-18
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个基于DeepSeek-R1蒸馏的中文数据集,旨在帮助复现R1蒸馏模型的效果,包含总计110k个样本,涵盖数学、考试、STEM和通用类型数据。数据字段包括输入、思考过程、输出和数据来源。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务