基于DeepSeek蒸馏的传统中医SFT数据集

Name: 基于DeepSeek蒸馏的传统中医SFT数据集
Creator: maas
Published: 2026-05-23 22:53:01
License: 暂无描述

魔搭社区2026-05-23 更新2025-03-08 收录

下载链接：

https://modelscope.cn/datasets/huangxp/hwtcm-deepseek-r1-distill-data

下载链接

链接失效反馈

官方服务：

资源简介：

# 简介 DeepSeek蒸馏的传统中医数据集，原始数据来源于网络，未进行人工审查。 ## 7B模型微调效果 > 模型表现出了推理能力，准确性有待继续验证。 ![alt text](images/image_1.png "Title") ![alt text](images/image_2.png "Title") ![alt text](images/image_3.png "Title") ## 我们的其他产品 [中医NER](https://huggingface.co/Monor/hwtcmner)：能识别方剂、本草、来源、病名、症状、证型，也许是基于BERT开源模型中识别最好的模型。 [中医考试题](https://huggingface.co/datasets/Monor/hwtcm)：也许是全网最早开源、数据最多的中医考试题，我们内部将其用于模型训练的性能评测数据集。 [中医SFT数据集](https://huggingface.co/datasets/Monor/hwtcm-sft-v1)：中医QA数据集，用于SFT微调。 [仓公](https://huggingface.co/Monor/canggong-7b-instruct)：基于Qwen的指令微调模型（暂未开源）。 [仓公R1](https://huggingface.co/Monor/canggong-r1)：基于DeepSeek蒸馏的超过100万条QA的指令微调模型，拥有强大的推理能力（暂未开源）。。。。还有很多 ## Citation If you find this project useful in your research, please consider cite: ``` @misc{hwtcm2024, title={{hwtcm-deepseek-r1-distill-data} A traditional Chinese medicine reasoning QA dataset for fine-tuning large language models}, author={Haiwei AI Team}, howpublished = {\url{https://huggingface.co/datasets/Monor/hwtcm-deepseek-r1-distill-data}}, year={2025} } ``` ## 硬广 [我](https://github.com/huangxinping) [我们](https://zhongyigen.com)

# 简介由DeepSeek蒸馏得到的传统中医数据集，其原始数据取自公开网络，未经人工审核。 ## 7B模型微调效果 > 该模型已展现出推理能力，但其准确性仍需进一步验证。 ![alt text](images/image_1.png "Title") ![alt text](images/image_2.png "Title") ![alt text](images/image_3.png "Title") ## 我们的其他产品 [中医命名实体识别（NER）](https://huggingface.co/Monor/hwtcmner)：可识别方剂、本草、来源、病名、症状及证型，堪称基于BERT开源模型中表现最优的同类模型。 [中医考试题集](https://huggingface.co/datasets/Monor/hwtcm)：据了解为全球范围内最早开源且规模最大的中医考试题集，本团队内部将其用作大语言模型（LLM）训练的性能评测数据集。 [中医监督微调（SFT）数据集](https://huggingface.co/datasets/Monor/hwtcm-sft-v1)：该数据集为中医问答（QA）语料库，用于大语言模型（LLM）的监督微调。 [仓公](https://huggingface.co/Monor/canggong-7b-instruct)：基于Qwen开发的指令微调大语言模型（LLM），目前暂未开源。 [仓公R1](https://huggingface.co/Monor/canggong-r1)：基于DeepSeek蒸馏技术、依托超100万条问答（QA）语料训练的指令微调模型，具备极强的推理能力，目前暂未开源。另有多款相关产品，恕不一一列举。 ## Citation 若本数据集对您的研究有所助益，请引用如下文献： @misc{hwtcm2024, title={{hwtcm-deepseek-r1-distill-data} A traditional Chinese medicine reasoning QA dataset for fine-tuning large language models}, author={Haiwei AI Team}, howpublished = {url{https://huggingface.co/datasets/Monor/hwtcm-deepseek-r1-distill-data}}, year={2025} } ## 硬广 [作者本人](https://github.com/huangxinping) [团队官网](https://zhongyigen.com)

提供机构：

maas

创建时间：

2025-03-05

搜集汇总

数据集介绍