five

基于DeepSeek蒸馏的传统中医SFT数据集

收藏
魔搭社区2026-05-23 更新2025-03-08 收录
下载链接:
https://modelscope.cn/datasets/huangxp/hwtcm-deepseek-r1-distill-data
下载链接
链接失效反馈
官方服务:
资源简介:
# 简介 DeepSeek蒸馏的传统中医数据集,原始数据来源于网络,未进行人工审查。 ## 7B模型微调效果 > 模型表现出了推理能力,准确性有待继续验证。 ![alt text](images/image_1.png "Title") ![alt text](images/image_2.png "Title") ![alt text](images/image_3.png "Title") ## 我们的其他产品 [中医NER](https://huggingface.co/Monor/hwtcmner):能识别方剂、本草、来源、病名、症状、证型,也许是基于BERT开源模型中识别最好的模型。 [中医考试题](https://huggingface.co/datasets/Monor/hwtcm):也许是全网最早开源、数据最多的中医考试题,我们内部将其用于模型训练的性能评测数据集。 [中医SFT数据集](https://huggingface.co/datasets/Monor/hwtcm-sft-v1):中医QA数据集,用于SFT微调。 [仓公](https://huggingface.co/Monor/canggong-7b-instruct):基于Qwen的指令微调模型(暂未开源)。 [仓公R1](https://huggingface.co/Monor/canggong-r1):基于DeepSeek蒸馏的超过100万条QA的指令微调模型,拥有强大的推理能力(暂未开源)。 。。。还有很多 ## Citation If you find this project useful in your research, please consider cite: ``` @misc{hwtcm2024, title={{hwtcm-deepseek-r1-distill-data} A traditional Chinese medicine reasoning QA dataset for fine-tuning large language models}, author={Haiwei AI Team}, howpublished = {\url{https://huggingface.co/datasets/Monor/hwtcm-deepseek-r1-distill-data}}, year={2025} } ``` ## 硬广 [我](https://github.com/huangxinping) [我们](https://zhongyigen.com)

# 简介 由DeepSeek蒸馏得到的传统中医数据集,其原始数据取自公开网络,未经人工审核。 ## 7B模型微调效果 > 该模型已展现出推理能力,但其准确性仍需进一步验证。 ![alt text](images/image_1.png "Title") ![alt text](images/image_2.png "Title") ![alt text](images/image_3.png "Title") ## 我们的其他产品 [中医命名实体识别(NER)](https://huggingface.co/Monor/hwtcmner):可识别方剂、本草、来源、病名、症状及证型,堪称基于BERT开源模型中表现最优的同类模型。 [中医考试题集](https://huggingface.co/datasets/Monor/hwtcm):据了解为全球范围内最早开源且规模最大的中医考试题集,本团队内部将其用作大语言模型(LLM)训练的性能评测数据集。 [中医监督微调(SFT)数据集](https://huggingface.co/datasets/Monor/hwtcm-sft-v1):该数据集为中医问答(QA)语料库,用于大语言模型(LLM)的监督微调。 [仓公](https://huggingface.co/Monor/canggong-7b-instruct):基于Qwen开发的指令微调大语言模型(LLM),目前暂未开源。 [仓公R1](https://huggingface.co/Monor/canggong-r1):基于DeepSeek蒸馏技术、依托超100万条问答(QA)语料训练的指令微调模型,具备极强的推理能力,目前暂未开源。 另有多款相关产品,恕不一一列举。 ## Citation 若本数据集对您的研究有所助益,请引用如下文献: @misc{hwtcm2024, title={{hwtcm-deepseek-r1-distill-data} A traditional Chinese medicine reasoning QA dataset for fine-tuning large language models}, author={Haiwei AI Team}, howpublished = {url{https://huggingface.co/datasets/Monor/hwtcm-deepseek-r1-distill-data}}, year={2025} } ## 硬广 [作者本人](https://github.com/huangxinping) [团队官网](https://zhongyigen.com)
提供机构:
maas
创建时间:
2025-03-05
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个用于微调大型语言模型的传统中医问答数据集,数据来源于互联网且未经人工审核,具备推理能力但准确性待验证。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务