面向中医智能辅助诊断的大规模舌象多模态标注与分析数据
收藏浙江省数据知识产权登记平台2026-05-22 更新2026-05-24 收录
下载链接:
https://www.zjip.org.cn/home/announce/trends/8447701
下载链接
链接失效反馈官方服务:
资源简介:
本数据可以应用在AI舌诊大模型的训练与微调,实现自动识别舌体形态(如胖大、瘦小、裂纹、齿痕)、舌色(淡红、绛紫、青紫等)、苔色(白、黄、灰、黑)、苔质(厚腻、薄润、剥脱、燥裂)等核心舌象特征。此外,还可以集成在健康管理APP、基层医疗辅助系统中,为用户提供体质辨识、亚健康筛查以及养生建议等服务。1、加工前的数据说明
原始数据为用户上传的舌部图像,主要来源于智能手机摄像头或具备标准光源的便携式舌象采集设备。图像格式为常见的 JPEG 或 PNG,分辨率通常不低于 1920×1080 像素。
2、处理规则
处理过程采用分阶段的图像分析流程:
①首先,对原始图像进行基础预处理,包括白平衡校正、亮度/对比度调整和简单背景分割,以减少拍摄环境差异对识别结果的影响;
②随后,使用基于深度学习的目标检测模型(以 YOLOv8 为基础架构)定位舌体区域,并同步识别多项舌象特征;
③最后,结合中医诊断规则库(参考《中医诊断学》及行业共识),将模型输出的视觉特征转化为结构化的舌诊描述,例如“舌质淡红、苔薄白”或“舌红少苔、有裂纹”等,并基于分类模型将概率最大的体质类型作为初步判断的体质倾向(如湿热、气虚等),其概率值作为体质辨识结果的置信度评分,数值范围在0至1之间,该评分越高,判断结果越可靠。整个处理逻辑遵循临床舌诊的基本原则。
3、数据内容描述
最终形成的数据集合包含以下内容:舌象图像、结构化舌诊文本描述、体质类型建议及其置信度评分。
所有自动分析结果均经过中医师抽样复核或多人交叉验证,确保其在临床语境下的合理性和一致性,数据集质量很高。本数据集可用于训练、测试和优化中医舌诊相关的AI模型,也可作为教学或科研的标准化参考资源。
提供机构:
杭州八脉科技有限公司
创建时间:
2026-03-09
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是面向中医智能辅助诊断的大规模舌象多模态标注与分析数据,包含舌部图像、结构化舌诊文本描述、体质辨识结果及其置信度评分,数据规模为149.22MB,格式为zip。数据源于手机或专业设备采集,经深度学习模型(如YOLOv8)和中医诊断规则库处理,可识别舌体形态、舌色、苔色等特征,并生成体质倾向(如湿热质),用于AI舌诊大模型的训练、微调,以及健康管理APP和基层医疗辅助系统中的自动辨识与养生建议服务。数据质量经过中医师抽样复核,具有较高的临床合理性和一致性。
以上内容由遇见数据集搜集并总结生成



