five

medical-o1-sft数据集

收藏
github2025-02-25 更新2025-03-01 收录
下载链接:
https://github.com/Nano-cd/deepseek-lora-medical
下载链接
链接失效反馈
官方服务:
资源简介:
包含了医疗诊断问题、复杂思维链和标准回答的自定义医疗问答数据集。

A customized medical question answering dataset containing medical diagnosis questions, complex chain-of-thought samples, and standard reference answers.
创建时间:
2025-02-25
原始信息汇总

deepseek-lora-medical 数据集概述

数据集简介

  • 名称:deepseek-lora-medical
  • 用途:用于对DeepSeek-R1-Distill-Qwen-1.5B模型进行医疗诊断问题微调的数据集

模型简介

  • 基础模型:DeepSeek-R1-Distill-Qwen-1.5B
  • 特点:轻量级大语言模型,经过蒸馏优化,适用于有限计算资源下的微调和部署

数据集详情

  • 数据集名称:medical_o1_sft_Chinese.json
  • 数据内容:包含医疗诊断问题、复杂思维链和标准回答
  • 数据格式:JSON json { "Question": "患者提出的医疗问题", "Complex_CoT": "详细的思维分析过程", "Response": "规范的医疗建议回答" }

环境要求

  • Python 3.8+
  • PyTorch 2.0+
  • transformers 4.30+
  • peft 0.4+
  • datasets
  • matplotlib
  • CUDA环境(GPU必须)

安装指南

  • pip install torch torchvision torchaudio
  • pip install transformers peft datasets matplotlib

使用方法

  1. 准备数据集文件medical_o1_sft_Chinese.json
  2. 调整配置参数(如需要)
  3. 运行训练脚本

训练参数说明

  • LoRA配置:r=16,lora_alpha=32,target_modules=["q_proj", "v_proj"],lora_dropout=0.05
  • 训练配置:批处理大小=2,训练轮次=3,学习率=3e-3,使用FP16混合精度训练

微调结果

  • 模型保存路径:models目录
  • 训练损失曲线图:loss_curve.png

模型评估与应用

  • 可用于医疗咨询系统、智能医疗助手、辅助医生进行诊断分析

项目优势

  1. 参数高效训练:使用LoRA技术
  2. 资源友好:针对显存优化
  3. 可视化监控:提供损失曲线
  4. 中文医疗领域专精

注意事项

  • 本模型仅作为医疗辅助工具,不应替代专业医生诊断和建议
  • 实际使用时需评估模型输出的准确性和适用性

贡献指南

  • 欢迎提交问题和改进建议
  • 贡献代码前请提交issue讨论改动

联系方式

  • chengdigogogo@outlook.com
搜集汇总
数据集介绍
main_image_url
构建方式
medical-o1-sft数据集的构建,旨在满足医疗诊断模型微调的需求。数据集通过整合医疗诊断问题、详细的思维分析过程以及规范的医疗建议回答,形成了包含丰富医疗领域知识的自定义问答数据集。该数据集以JSON格式存储,每一数据点包含问题、复杂思维链和标准回答三个部分,为模型的微调提供了精准且必要的训练数据。
特点
该数据集显著的特点在于其专业性和细粒度的信息结构。数据集专注于中文医疗诊断场景,不仅涵盖了广泛的问题类型,还包含了详细的思维分析过程,有助于模型理解医疗诊断的复杂逻辑。此外,数据集采用JSON格式,便于处理和集成到不同的应用中。其资源友好和针对中文医疗领域的优化,使得该数据集在同类数据集中独树一帜。
使用方法
使用medical-o1-sft数据集进行模型微调,首先需要准备数据集文件`medical_o1_sft_Chinese.json`,随后调整配置参数,并运行训练脚本。整个训练过程支持FP16混合精度训练,有助于提高训练效率和模型的泛化能力。训练完成后,可通过生成的损失曲线图`loss_curve.png`来评估模型训练的稳定性和有效性,进而将微调后的模型应用于医疗咨询系统、智能医疗助手等场景中。
背景与挑战
背景概述
medical-o1-sft数据集,作为医疗诊断模型微调项目的重要组成部分,其创建旨在提升DeepSeek-R1-Distill-Qwen-1.5B模型在处理医疗诊断问题时的回答能力。该数据集由DeepSeek团队开发,包含了医疗诊断问题、复杂的思维链和标准回答,是针对中文医疗诊断场景进行优化的重要资源。自推出以来,该数据集为相关领域的研究提供了有力支撑,对提高医疗诊断模型的准确性和实用性具有显著影响。
当前挑战
在数据集的应用过程中,研究人员面临着如何有效微调模型以适应复杂医疗场景的挑战。此外,构建过程中遇到的挑战包括数据集的多样性和覆盖性,确保模型不会因数据偏差而产生误导性诊断。同时,如何在保持模型性能的同时,优化资源使用,尤其是显存优化,也是当前的重要挑战之一。
常用场景
经典使用场景
在医疗诊断模型的微调领域,medical-o1-sft数据集的应用尤为关键。该数据集包含了医疗诊断问题、详细的思维分析过程以及规范的医疗建议回答,为模型的微调提供了丰富的、针对性的训练材料,使其能更好地理解和应对医疗场景中的复杂问题。
衍生相关工作
基于medical-o1-sft数据集的研究,已经衍生出了一系列相关工作,如使用LoRA技术对DeepSeek-R1-Distill-Qwen-1.5B模型进行微调等。这些工作进一步推动了医疗诊断模型的发展,为医疗信息处理领域带来了新的技术和方法。
数据集最近研究
最新研究方向
针对医疗诊断领域,近期研究集中于利用medical-o1-sft数据集对DeepSeek-R1-Distill-Qwen-1.5B模型进行LoRA微调,以增强模型在处理中文医疗问题时的准确性和响应能力。此研究方向紧密结合了参数高效训练技术,不仅降低了训练成本,同时提高了模型在医疗咨询、智能助手及诊断分析等应用场景中的性能,对提升医疗信息化水平具有重要意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作