TongueDx Dataset
收藏arXiv2025-01-06 更新2025-01-08 收录
下载链接:
https://github.com/tonguedx/tonguedx
下载链接
链接失效反馈官方服务:
资源简介:
TongueDx数据集是一个专为远程舌诊研究设计的综合性舌象图像数据集,由香港理工大学和新加坡管理大学的研究团队创建。该数据集包含5109张图像,涵盖了多种环境条件下的舌象,图像通过智能手机和笔记本电脑摄像头采集,具有较高的多样性和代表性。数据集不仅包含舌象图像,还提供了详细的舌面属性标注,如舌色、舌苔厚度等,并附有受试者的年龄、性别等人口统计信息。数据集的创建过程包括图像采集、舌象分割、标准化处理和多标签标注,旨在解决远程医疗中舌诊图像质量不一致的问题。该数据集的应用领域主要集中在远程医疗和中医诊断,旨在通过自动化技术提高舌诊的准确性和可靠性。
The TongueDx dataset is a comprehensive tongue image dataset specifically designed for remote tongue diagnosis research, created by research teams from The Hong Kong Polytechnic University and Singapore Management University. This dataset contains 5109 tongue images captured under various environmental conditions using smartphones and laptop cameras, boasting high diversity and representativeness. In addition to the tongue images, the dataset also provides detailed annotations of tongue surface attributes such as tongue color and tongue coating thickness, along with demographic information of the subjects including age and gender. The dataset creation process includes image collection, tongue segmentation, standardization processing and multi-label annotation, aiming to address the issue of inconsistent quality of tongue diagnosis images in telemedicine. The application scenarios of this dataset mainly focus on telemedicine and traditional Chinese medicine (TCM) diagnosis, with the goal of improving the accuracy and reliability of tongue diagnosis through automated technologies.
提供机构:
香港理工大学护理学院, 新加坡管理大学
创建时间:
2025-01-06
搜集汇总
数据集介绍

构建方式
TongueDx数据集的构建旨在支持远程舌诊的自动化识别技术。该数据集通过收集在自然环境下使用不同智能手机和笔记本电脑摄像头拍摄的舌象图像,涵盖了多样化的环境条件、图像分辨率和拍摄角度。为了确保数据的多样性和代表性,图像采集过程中考虑了不同的光照条件和设备特性。此外,数据集还包含了详细的舌象属性标注,如舌色、舌苔等,这些标注由专业医师通过临床观察完成,确保了数据的准确性和可靠性。
特点
TongueDx数据集的特点在于其专为远程诊断设计,涵盖了广泛的舌象属性标签,包括舌色、舌苔厚度、裂纹等。数据集的图像采集环境多样化,模拟了真实远程医疗场景中的复杂条件,如不同的光照和设备特性。此外,数据集还包含了丰富的元数据,如年龄和性别信息,为未来的研究提供了更多可能性。这种多样性和全面性使得TongueDx成为舌诊自动化研究中的宝贵资源。
使用方法
TongueDx数据集的使用方法主要围绕远程舌诊的自动化识别任务展开。研究人员可以利用该数据集训练和验证舌象属性识别模型,特别是针对多标签分类任务。数据集中的图像经过标准化处理,包括舌体检测、分割和直立化,以减少环境因素的干扰。通过结合自适应舌象特征提取模块和面向属性的识别网络(SignNet),研究人员可以实现对舌象属性的精确识别,模拟中医医师的诊断过程,从而为远程医疗提供可靠的支持。
背景与挑战
背景概述
TongueDx数据集由香港理工大学护理学院的研究团队于2025年创建,旨在推动远程舌诊技术的发展。该数据集的核心研究问题是通过多标签属性检测框架,实现舌象特征的自动识别,以支持远程医疗中的精准诊断。舌诊作为中医和西医中的重要诊断工具,能够通过分析舌头的颜色、纹理等特征,提供患者健康状况的关键信息。COVID-19疫情的爆发进一步凸显了远程医疗的迫切需求,而TongueDx数据集的推出为这一领域提供了重要的研究资源。该数据集不仅包含大量舌象图像,还涵盖了详细的属性标签和人口统计信息,为舌诊自动化技术的开发奠定了坚实基础。
当前挑战
TongueDx数据集在构建和应用中面临多重挑战。首先,远程舌诊的核心问题在于如何从低分辨率和复杂光照条件下的舌象图像中提取准确的诊断信息。智能手机摄像头的美化功能和环境光线的变化可能导致舌象颜色和纹理的失真,进而影响诊断的准确性。其次,数据集的构建过程中,研究人员需要克服图像质量不一致、环境干扰以及舌象姿态变化等问题。尽管现有的舌诊数据集多依赖于标准化设备,但这些设备无法完全模拟远程医疗场景的多样性。此外,TongueDx数据集的多标签属性检测任务要求模型能够同时识别多个舌象特征,这对算法的复杂性和鲁棒性提出了更高的要求。
常用场景
经典使用场景
TongueDx数据集在远程舌诊领域具有广泛的应用场景,尤其是在结合传统中医与现代医学的背景下。该数据集通过标准化舌象图像并减少环境因素的干扰,为远程医疗中的舌诊提供了可靠的数据支持。其经典使用场景包括在远程医疗平台中,通过自动化技术识别舌象特征,帮助医生进行健康评估和疾病诊断。特别是在COVID-19疫情期间,远程医疗需求激增,TongueDx数据集为远程舌诊提供了重要的技术支持。
实际应用
TongueDx数据集在实际应用中具有广泛的潜力,特别是在远程医疗和健康监测领域。通过该数据集,医生可以远程获取患者的舌象信息,并结合其他健康数据进行综合评估。此外,该数据集还可用于开发智能舌诊设备,帮助患者在家中进行自我健康监测。其公开可用的特性也为研究人员和开发者提供了宝贵的资源,推动了舌诊技术的普及和应用。
衍生相关工作
TongueDx数据集衍生了一系列相关研究工作,特别是在舌象特征识别和远程医疗领域。基于该数据集的研究提出了多种深度学习模型,如自适应舌象特征提取模块和SignNet网络,显著提升了舌象识别的准确性和鲁棒性。此外,该数据集还推动了舌象与其他健康指标关联的研究,如舌象与胃部疾病的关联分析。这些工作不仅扩展了舌诊的应用范围,也为未来的远程医疗技术发展奠定了基础。
以上内容由遇见数据集搜集并总结生成



