medical-o1-sft数据集

github2025-02-25 更新2025-03-01 收录

医疗问答

自然语言处理

数据链接：

https://github.com/Nano-cd/deepseek-lora-medical 数据链接链接失效反馈

官方服务：

资源简介：

包含了医疗诊断问题、复杂思维链和标准回答的自定义医疗问答数据集。

A customized medical question answering dataset containing medical diagnosis questions, complex chain-of-thought samples, and standard reference answers.

创建时间：

2025-02-25

原始信息汇总

deepseek-lora-medical 数据集概述

数据集简介

名称：deepseek-lora-medical
用途：用于对DeepSeek-R1-Distill-Qwen-1.5B模型进行医疗诊断问题微调的数据集

模型简介

基础模型：DeepSeek-R1-Distill-Qwen-1.5B
特点：轻量级大语言模型，经过蒸馏优化，适用于有限计算资源下的微调和部署

数据集详情

数据集名称：medical_o1_sft_Chinese.json
数据内容：包含医疗诊断问题、复杂思维链和标准回答
数据格式：JSON json { "Question": "患者提出的医疗问题", "Complex_CoT": "详细的思维分析过程", "Response": "规范的医疗建议回答" }

环境要求

Python 3.8+
PyTorch 2.0+
transformers 4.30+
peft 0.4+
datasets
matplotlib
CUDA环境（GPU必须）

安装指南

pip install torch torchvision torchaudio
pip install transformers peft datasets matplotlib

使用方法

准备数据集文件medical_o1_sft_Chinese.json
调整配置参数（如需要）
运行训练脚本

训练参数说明

LoRA配置：r=16，lora_alpha=32，target_modules=["q_proj", "v_proj"]，lora_dropout=0.05
训练配置：批处理大小=2，训练轮次=3，学习率=3e-3，使用FP16混合精度训练

微调结果

模型保存路径：models目录
训练损失曲线图：loss_curve.png

模型评估与应用

可用于医疗咨询系统、智能医疗助手、辅助医生进行诊断分析

项目优势

参数高效训练：使用LoRA技术
资源友好：针对显存优化
可视化监控：提供损失曲线
中文医疗领域专精

注意事项

本模型仅作为医疗辅助工具，不应替代专业医生诊断和建议
实际使用时需评估模型输出的准确性和适用性

贡献指南

欢迎提交问题和改进建议
贡献代码前请提交issue讨论改动

联系方式

chengdigogogo@outlook.com

搜集汇总

数据集介绍

构建方式

medical-o1-sft数据集的构建，旨在满足医疗诊断模型微调的需求。数据集通过整合医疗诊断问题、详细的思维分析过程以及规范的医疗建议回答，形成了包含丰富医疗领域知识的自定义问答数据集。该数据集以JSON格式存储，每一数据点包含问题、复杂思维链和标准回答三个部分，为模型的微调提供了精准且必要的训练数据。

特点

该数据集显著的特点在于其专业性和细粒度的信息结构。数据集专注于中文医疗诊断场景，不仅涵盖了广泛的问题类型，还包含了详细的思维分析过程，有助于模型理解医疗诊断的复杂逻辑。此外，数据集采用JSON格式，便于处理和集成到不同的应用中。其资源友好和针对中文医疗领域的优化，使得该数据集在同类数据集中独树一帜。

使用方法

使用medical-o1-sft数据集进行模型微调，首先需要准备数据集文件`medical_o1_sft_Chinese.json`，随后调整配置参数，并运行训练脚本。整个训练过程支持FP16混合精度训练，有助于提高训练效率和模型的泛化能力。训练完成后，可通过生成的损失曲线图`loss_curve.png`来评估模型训练的稳定性和有效性，进而将微调后的模型应用于医疗咨询系统、智能医疗助手等场景中。

背景与挑战

背景概述

medical-o1-sft数据集，作为医疗诊断模型微调项目的重要组成部分，其创建旨在提升DeepSeek-R1-Distill-Qwen-1.5B模型在处理医疗诊断问题时的回答能力。该数据集由DeepSeek团队开发，包含了医疗诊断问题、复杂的思维链和标准回答，是针对中文医疗诊断场景进行优化的重要资源。自推出以来，该数据集为相关领域的研究提供了有力支撑，对提高医疗诊断模型的准确性和实用性具有显著影响。

当前挑战

在数据集的应用过程中，研究人员面临着如何有效微调模型以适应复杂医疗场景的挑战。此外，构建过程中遇到的挑战包括数据集的多样性和覆盖性，确保模型不会因数据偏差而产生误导性诊断。同时，如何在保持模型性能的同时，优化资源使用，尤其是显存优化，也是当前的重要挑战之一。

常用场景

经典使用场景

在医疗诊断模型的微调领域，medical-o1-sft数据集的应用尤为关键。该数据集包含了医疗诊断问题、详细的思维分析过程以及规范的医疗建议回答，为模型的微调提供了丰富的、针对性的训练材料，使其能更好地理解和应对医疗场景中的复杂问题。

衍生相关工作

基于medical-o1-sft数据集的研究，已经衍生出了一系列相关工作，如使用LoRA技术对DeepSeek-R1-Distill-Qwen-1.5B模型进行微调等。这些工作进一步推动了医疗诊断模型的发展，为医疗信息处理领域带来了新的技术和方法。

数据集最近研究