Open-Source Periorbital Segmentation Dataset
收藏arXiv2024-09-30 更新2024-10-02 收录
下载链接:
https://pypi.org/project/periorbital-package/
下载链接
链接失效反馈官方服务:
资源简介:
Open-Source Periorbital Segmentation Dataset是由伊利诺伊大学芝加哥分校医学院创建的,用于眼科整形和颅面分割任务的开源数据集。该数据集包含2842张图像,涵盖了虹膜、巩膜、眼睑、结膜和眉毛的详细标注。数据集的创建过程包括从两个开源数据集(Chicago Facial Dataset和CelebAMask-HQ)中提取图像,并由五名经过训练的标注者进行标注。该数据集的应用领域主要集中在眼科整形手术中的分割任务,旨在通过深度学习模型提高分割的准确性和临床实用性。
Open-Source Periorbital Segmentation Dataset was developed by the College of Medicine, University of Illinois Chicago, as an open-source dataset for ophthalmic plastic and craniofacial segmentation tasks. This dataset contains 2842 images with detailed annotations for the iris, sclera, eyelids, conjunctiva, and eyebrows. The dataset construction process involved extracting images from two existing open-source datasets, namely the Chicago Facial Dataset and CelebAMask-HQ, followed by manual annotation conducted by five trained annotators. The primary application scenarios of this dataset focus on segmentation tasks in ophthalmic plastic surgery, aiming to improve segmentation accuracy and clinical practicality through deep learning models.
提供机构:
伊利诺伊大学芝加哥分校医学院
创建时间:
2024-09-30
搜集汇总
数据集介绍

构建方式
该数据集的构建基于两个开源数据集:Chicago Facial Dataset (CFD) 和 CelebAMask-HQ Dataset (Celeb)。首先,从这两个数据集中选取包含眼睛的图像,并使用Mediapipe Facemesh进行裁剪,以确保仅包含眼周区域。随后,由五名经过训练的标注员使用Computer Vision Annotation Tool (CVAT)对图像中的虹膜、巩膜、眼睑、结膜和眉毛进行标注。为了确保标注质量,进行了内标注员和外标注员的可靠性验证,通过随机选取100张图像进行重复标注,并计算Dice分数以评估一致性。最终,共标注了2842张图像,所有标注数据均以COCO格式导出并进行后处理,确保每个解剖结构由特定的像素值表示。
特点
该数据集的显著特点在于其高精度的眼周解剖结构标注,涵盖了虹膜、巩膜、眼睑、结膜和眉毛等多个关键区域。通过内标注员和外标注员的验证,数据集展示了较高的标注一致性,平均Dice分数达到0.82。此外,数据集还提供了用于眼周距离预测的开源工具包,支持从分割掩码中计算眼周距离,进一步增强了其在临床应用中的实用性。所有模型权重和标注数据均公开可用,促进了社区的进一步研究和模型开发。
使用方法
该数据集适用于训练深度学习模型进行眼周区域的分割任务,特别适用于眼科和颅面外科的临床应用。用户可以通过下载公开的标注数据和模型权重,使用提供的开源工具包进行眼周距离的预测。具体使用方法包括:首先,加载预训练的DeepLabV3模型或自行训练的分割模型;其次,输入图像进行分割,获取眼周区域的分割掩码;最后,利用工具包计算眼周距离,如虹膜直径、巩膜显示、眼睑到虹膜距离等。此外,用户还可以通过API接口提交图像或分割掩码,直接获取眼周距离的计算结果,极大地方便了临床和研究中的应用。
背景与挑战
背景概述
在眼科领域,尽管已有多种开源数据集用于分类和分割任务,如光学相干断层扫描图像、眼底照片等,但针对外部眼部图像的深度学习训练数据集相对稀缺。特别是,现有的开源数据集主要用于生物识别和虹膜识别系统,缺乏针对眼科整形和颅面外科手术所需的详细眼周解剖标注。为了填补这一空白,George R. Nahass等人于2021年创建了Open-Source Periorbital Segmentation Dataset,旨在为眼科整形分割和眼周距离预测提供数据支持。该数据集整合了Chicago Facial Dataset和CelebAMask-HQ Dataset,通过五名训练有素的标注者对虹膜、巩膜、眼睑、结膜和眉毛进行详细标注,并验证了标注的一致性和模型的有效性。这一数据集的发布,标志着眼科整形和颅面外科领域在深度学习应用方面迈出了重要一步,为未来开发临床实用的分割网络奠定了基础。
当前挑战
尽管Open-Source Periorbital Segmentation Dataset在眼科整形和颅面外科领域具有重要意义,但其构建过程中仍面临诸多挑战。首先,数据集的标注过程复杂,需要五名标注者对每张图像进行详细标注,确保标注的一致性和准确性。其次,数据集的多样性受限于原始数据集的特性,如CelebAMask-HQ Dataset缺乏种族和性别元数据,可能影响模型的泛化能力。此外,尽管标注者在标注过程中表现出较高的一致性,但仍存在一定的主观性和变异性,特别是在标注较小的解剖结构时。最后,深度学习模型在眼睑和结膜的分割上表现相对较弱,表明模型仍有改进空间。这些挑战不仅影响了数据集的质量,也对未来模型的开发和应用提出了更高的要求。
常用场景
经典使用场景
在眼科应用领域,Open-Source Periorbital Segmentation Dataset 被广泛用于训练深度学习模型,以实现对眼周区域的精确分割。该数据集通过标注虹膜、巩膜、眼睑、结膜和眉毛等关键结构,为眼科整形手术中的分割任务提供了高质量的训练数据。通过使用该数据集,研究人员能够开发出能够准确预测眼周距离的算法,从而在临床实践中显著提高诊断和治疗的效率。
解决学术问题
Open-Source Periorbital Segmentation Dataset 解决了眼科领域中缺乏高质量眼周图像分割数据集的问题。传统上,眼科图像的分割主要依赖于内眼图像数据集,而对外眼图像的分割数据集则相对匮乏。该数据集通过提供详细的眼周解剖结构标注,填补了这一空白,使得研究人员能够更有效地开发和验证用于眼科整形和颅面手术的分割模型,从而推动了相关领域的学术研究进展。
衍生相关工作
基于 Open-Source Periorbital Segmentation Dataset,研究人员开发了多种用于眼周距离预测和疾病分类的深度学习模型。例如,一些研究工作利用该数据集训练的模型实现了对眼睑和眼周结构的高精度分割,并进一步用于自动化眼周距离的测量。此外,该数据集还促进了眼科整形手术中自动化诊断和治疗方案的制定,为临床实践提供了有力的技术支持。
以上内容由遇见数据集搜集并总结生成



