medical-o1-reasoning-SFT

github2025-03-08 更新2025-03-24 收录

下载链接：

https://github.com/Haohao-end/unsloth-fine-tuning-framework-with-LoRA-and-CoT-Q-A-data-set-wandb-visual-training-logs

下载链接

链接失效反馈

官方服务：

资源简介：

500+ 中文医疗场景问答，包含详细思维链标注，覆盖常见疾病诊断路径。

Over 500 Chinese medical scenario Q&A pairs, with detailed chain-of-thought annotations, covering common disease diagnosis pathways.

创建时间：

2025-03-08

原始信息汇总

DeepSeek-R1 医疗诊断大模型微调指南

项目亮点

闪电训练：基于Unsloth框架，提速2倍显存节省80%。
医学思维链：引入CoT推理让诊断过程透明化。
专业领域适配：专治模型医学知识贫血症。
训练可视化：wandb实时监控训练过程，效果看得见。
精准微调：LoRA技术实现外科手术式参数调整。

快速开始

环境配置

bash sudo apt install python3-venv python3 -m venv unsloth source unsloth/bin/activate pip install unsloth wandb python-dotenv

启动微调

bash python r1-finetuning-unsloth.py

训练过程可视化

python wandb.init(project=Fine-tune-DeepSeek-R1)

效果对比

微调前

text "建议多喝水，注意休息..."

微调后

text "根据病毒性感冒的典型病程：

退烧药仅对症处理...
推荐使用奥司他韦...
需密切观察..."

数据集

python load_dataset("FreedomIntelligence/medical-o1-reasoning-SFT")

500+ 中文医疗场景问答
包含详细思维链标注
覆盖常见疾病诊断路径

技术配置

组件	配置	说明
模型	DeepSeek-R1-Distill-Qwen-1.5B	医学知识蒸馏版
LoRA	r=16, alpha=16	精准参数调整
量化	4bit 加载	显存优化黑科技
训练	BF16混合精度	速度精度双保障

模型保存

python model.save_pretrained_merged("My_Medical_GPT", save_method="merged_16bit")

模型部署

python model.push_to_hub_merged("YourName/Medical-R1")

注意事项

使用前记得替换代码中的hf_token和wb_token
建议先在500条数据上试跑，再扩展数据集
医疗内容仅供参考，实际应用需专业审核

搜集汇总

数据集介绍

构建方式

medical-o1-reasoning-SFT数据集的构建基于中文医疗场景的问答数据，涵盖了500多个具体的医疗案例。每个案例均包含详细的思维链标注，确保模型能够理解并模拟医学诊断的逻辑过程。数据集的构建过程中，特别注重了疾病诊断路径的覆盖，使得模型能够在多样化的医疗情境中进行有效推理。

特点

该数据集的特点在于其专注于医疗推理领域，提供了丰富的思维链标注，使得模型能够透明化地展示诊断过程。此外，数据集覆盖了广泛的常见疾病诊断路径，确保了模型在多种医疗场景下的适用性。通过引入CoT（Chain of Thought）推理机制，数据集进一步增强了模型在复杂医疗问题中的推理能力。

使用方法

使用medical-o1-reasoning-SFT数据集时，首先需要通过Hugging Face的`load_dataset`函数加载数据。随后，可以利用LoRA技术对模型进行精准微调，确保模型在医疗推理任务中的表现达到最优。训练过程中，建议使用wandb进行实时监控，以便及时调整训练参数。训练完成后，模型可以保存为16位精度的格式，并上传至Hugging Face Hub，供进一步部署和应用。

背景与挑战

背景概述

medical-o1-reasoning-SFT数据集是由FreedomIntelligence团队开发，专注于医疗诊断推理领域的中文数据集。该数据集创建于2023年，旨在通过大模型微调技术提升AI在医疗诊断中的推理能力。数据集包含500多个中文医疗场景问答，涵盖常见疾病的诊断路径，并引入了思维链（CoT）推理，使得诊断过程更加透明化。该数据集的推出为医疗AI领域提供了重要的数据支持，推动了AI在医疗诊断中的应用，尤其是在中文语境下的疾病诊断和推理能力提升方面具有显著影响力。

当前挑战

medical-o1-reasoning-SFT数据集在解决医疗诊断推理问题时面临多重挑战。首先，医疗领域的复杂性和专业性要求模型具备高度的知识准确性和推理能力，如何确保模型在诊断过程中不产生误导性建议是一个关键挑战。其次，数据集的构建过程中，如何准确标注医疗场景的思维链推理路径，确保数据的质量和一致性，也是一个技术难点。此外，医疗数据的隐私性和敏感性要求数据处理过程中必须严格遵守相关法律法规，如何在保证数据安全的前提下进行有效的数据收集和标注，是构建该数据集时不可忽视的挑战。

常用场景

经典使用场景

在医疗诊断领域，medical-o1-reasoning-SFT数据集被广泛应用于训练和微调医疗推理模型。通过引入思维链（CoT）推理，该数据集使得模型能够模拟医生的诊断过程，逐步推理出疾病的可能性和治疗方案。这种透明化的推理过程不仅提高了模型的可解释性，还增强了其在复杂医疗场景中的适用性。

衍生相关工作

基于medical-o1-reasoning-SFT数据集，研究者们开发了多种医疗推理模型，如DeepSeek-R1。这些模型通过结合LoRA技术和思维链推理，显著提升了医疗诊断的准确性和效率。此外，该数据集还推动了医疗AI领域的开源社区发展，促进了更多相关研究和应用的涌现。

数据集最近研究