Citrus_S3, JMED

github2025-03-05 更新2025-02-26 收录

下载链接：

https://github.com/jdh-algo/Citrus

下载链接

链接失效反馈

官方服务：

资源简介：

Citrus_S3是模型训练数据，包含20k数据点。JMED是测试数据，来源于京东健康互联网医院匿名化医患对话，包含1,000高质量临床记录，涵盖所有年龄段（0-90岁）和多个专科。

Citrus_S3 is model training data containing 20,000 data points. JMED is test data sourced from anonymized doctor-patient dialogues from JD Health Internet Hospital, which includes 1,000 high-quality clinical records covering all age groups (0-90 years old) and multiple medical specialties.

创建时间：

2025-02-25

原始信息汇总

Citrus 数据集概述

简介

Citrus 是一种医学语言模型，通过模拟医学专家的认知过程，弥合临床专业知识与人工智能推理之间的差距。该模型基于大量模拟专家疾病推理数据进行训练，采用新颖的方法合成数据，准确捕捉临床医生的决策路径。

主要贡献

提出一种无训练推理方法，模拟医学专家的认知过程，增强大型语言模型在临床诊断和治疗中的医学能力。
结合数据构建方法，引入多阶段后训练方法，进一步提升模型的医学性能。
公开 Citrus 模型及其训练数据作为开源资源，推动 AI 驱动的医疗决策研究。
开发并开源基于真实世界数据的大规模可更新临床实践评估数据集，准确反映真实世界患者分布。

性能

Citrus1.0-Llama-70B 在 70B 规模模型中达到顶级性能，尤其在 MedQA、PubMedQA、MedBullets、CareQA 等基准测试中表现优异。Citrus 超越许多闭源顶级 LLM，如 Claude-sonnet 和 GPT-4o。

模型访问

模型名称	骨干模型	支持语言	链接
Citrus1.0-Llama-70B	LLaMA-3.1-70B	英语	HF Link
Citrus1.0-Qwen-72B	Qwen2.5-72B	英语 & 中文	HF Link

数据访问

数据名称	用途	描述	链接
Citrus_S3	训练数据	包含 20k 数据点的模型训练数据部分	Link
JMED	测试数据	源自京东健康互联网医院的匿名医患对话，筛选保留符合标准化诊断流程的咨询。初始发布包含 1,000 条高质量临床记录，涵盖所有年龄组（0-90 岁）和多个专科。	Link

代码使用

安装

bash

代码下载

git clone git@github.com:jdh-algo/Citrus.git

cd Citrus

安装依赖

1、python 环境 1.1 推荐使用 Anaconda 管理虚拟环境 1.2 conda create -n [env_name] python=3.10 1.3 conda activate [env_name] 2、安装 poetry: pip install poetry

3、使用 poetry 安装依赖: poetry install

模型使用

启动模型: 可使用骨干模型代码（Qwen, Llama）或通过 vllm 部署。

提示词: 使用以下提示词使模型以医学专家方式思考。

配置

yaml

LLMs API 配置文件: src/config/config/model_api.yml

open_ai:

url: ""
app_key: ""

local_vllm:

url: "127.0.0.1:8080"

运行

bash

数据预处理

cd src & python main.py --app data_preprocess --task_card config/task_card/create_origin_file.json

数据标注

cd src & python main.py --app data_preprocess --task_card config/task_card/data_label.json

SFT 数据合成 (Citrus_S3)

cd src & python main.py --app data_synthesis --task_card config/task_card/sft_data_synthesis.json

模型评估

cd src & python main.py --app evaluation --task_card config/task_card/model_evaluation.json

搜集汇总

数据集介绍

构建方式

Citrus_S3数据集的构建采用了模拟医学专家决策路径的创新方法，通过合成专家疾病推理数据，精确捕捉临床医生在诊疗过程中的认知过程。该数据集是通过对大量模拟的专家疾病推理数据进行整合而形成的，旨在训练语言模型，以增强其在临床诊断和治疗中的医学能力。

使用方法

使用Citrus_S3数据集，用户可以通过访问Hugging Face平台获取数据。数据集可用于训练和评估医学语言模型，如Citrus模型。用户需要安装必要的依赖，如Anaconda和poetry，并按照提供的代码示例启动模型服务，配置相关参数，执行数据预处理、标签标注、数据合成、样本抽取、模型评估以及模型训练等任务。

背景与挑战

背景概述

Citrus_S3数据集是一项旨在提升医疗语言模型临床决策支持能力的研究成果，由专家合成的疾病推理数据训练而成，模拟了医学专家的认知过程。该数据集的创建可追溯至近期，由jdh-algo团队主导，其核心研究问题是构建一个能够桥接临床专业知识和人工智能推理的模型。Citrus_S3的推出对AI驱动的医疗决策研究领域产生了显著影响，为相关研究和应用提供了开源资源。

当前挑战

该数据集在构建过程中遇到的挑战主要包括：1) 如何精确模拟医学专家的认知路径，确保模型能够反映实际的临床决策过程；2) 构建大规模、可更新的临床实践评估数据集，以真实反映不同年龄段和多个专业领域的患者分布。此外，数据集在解决医学领域问题，如临床诊断和治疗推理方面，也面临着如何提高语言模型的医学性能的挑战。

常用场景

经典使用场景

在医学领域，Citrus_S3数据集的经典使用场景在于辅助临床决策。该数据集通过模拟医学专家的认知路径，为大型语言模型提供了训练素材，使其在临床诊断和治疗建议方面具备更专业的推理能力。

解决学术问题

Citrus_S3数据集解决了医学推理中的关键学术问题，如如何将临床专业知识与人工智能推理相结合，以及如何训练模型以模拟医学专家的决策过程。通过该数据集，研究者能够开发出在医学问答和诊断支持任务上表现出色的模型。

实际应用

在实际应用中，基于Citrus_S3数据集训练出的模型可以用于临床咨询、病例分析和医学教育等多个领域。这些模型能够为医生提供决策支持，提高诊断的准确性和效率，同时也为患者提供更加个性化的医疗服务。

数据集最近研究