ZhongJing-OMNI
收藏ZhongJing-OMNI: 首个评估中医知识的多模态基准数据集
ZhongJing-OMNI 是首个用于评估大型语言模型中中医知识的多模态基准数据集。该数据集提供了多种类型的问题和多模态数据,结合视觉和文本信息,评估模型在复杂中医诊断和治疗场景中的推理能力。通过将中医文本知识与多模态舌诊数据相结合,该数据集为中医领域的AI研究设定了新的标准。
关键多模态特征:
- 选择题:涵盖中医核心概念、证候、诊断和草药配方。
- 开放式问题:专注于详细的诊断推理、治疗策略和中医原理的解释。
- 基于案例的问题:需要深入分析和综合治疗方案的真实临床案例。
- 多模态舌诊问答:高分辨率舌部图像与相应的诊断问题和专家答案配对,结合视觉和文本数据,评估模型对中医舌诊的理解。
该多模态数据集允许AI系统通过整合文本推理和视觉诊断技能,更深入、更全面地理解中医,成为医疗AI研究的重要资源。
数据集结构
MCQ/:选择题及其答案。OpenQA/:开放式问题及其详细答案。CaseQA/:基于临床案例的问题和答案。TongueDiagnosis/:高质量舌诊图像及其配对的问答数据。
如何使用
1. 克隆仓库:
bash git clone https://github.com/pariskang/ZhongJing-OMNI.git
2. 加载数据集:
python import pandas as pd
加载选择题数据
mcq_data = pd.read_csv(MCQ/questions.csv)
加载开放式问答数据
openqa_data = pd.read_csv(OpenQA/questions.csv)
加载基于案例的问答数据
caseqa_data = pd.read_csv(CaseQA/questions.csv)
加载舌诊问答数据(多模态数据)
tongue_data = pd.read_csv(TongueDiagnosis/tongue_questions.csv)
3. 多模态舌诊示例:
python from PIL import Image
加载并显示一个舌诊图像示例
img = Image.open(TongueDiagnosis/images/tongue001.png) img.show()
加载相应的问答数据
with open(TongueDiagnosis/questions/tongue001_question.txt, r) as file: question = file.read() print(f"Question: {question}")
with open(TongueDiagnosis/answers/tongue001_answer.txt, r) as file: answer = file.read() print(f"Answer: {answer}")
为什么多模态?
ZhongJing-OMNI数据集引入了首个中医多模态组件,结合视觉和文本数据,这对于理解复杂的诊断特征(如舌色、形状和舌苔)至关重要。这使得模型能够:
- 学习如何整合视觉诊断特征与文本知识。
- 通过两种模态的联合推理来达到准确的中医诊断。
- 支持现实临床应用,其中视觉和文本数据是交织在一起的。
舌诊示例:气虚伴淡舌

该图像显示了一个淡色、略微肿胀的舌头,带有薄白舌苔。这些特征是中医气虚的典型表现。
此示例展示了使用Claude-3.5-Sonnet模型从我们的数据集中得出的实际测试结果。它展示了模型准确识别和描述中医舌诊图像关键特征的能力。
联系
如有问题或合作,请联系:Email: ylkan21@m.fudan.edu.cn
引用
如果您在研究或项目中使用ZhongJing-OMNI,请按如下方式引用:
@dataset{zhongjing_omni_2024, title = {ZhongJing-OMNI: The First Multimodal Benchmark for Evaluating Traditional Chinese Medicine}, author = {Kang, Yanlan}, year = {2024}, publisher = {GitHub}, journal = {GitHub repository}, url = {https://github.com/yourusername/ZhongJing-OMNI} }




