five

Open-Source Periorbital Segmentation Dataset|眼科整形数据集|图像分割数据集

收藏
arXiv2024-09-30 更新2024-10-02 收录
眼科整形
图像分割
下载链接:
https://pypi.org/project/periorbital-package/
下载链接
链接失效反馈
资源简介:
Open-Source Periorbital Segmentation Dataset是由伊利诺伊大学芝加哥分校医学院创建的,用于眼科整形和颅面分割任务的开源数据集。该数据集包含2842张图像,涵盖了虹膜、巩膜、眼睑、结膜和眉毛的详细标注。数据集的创建过程包括从两个开源数据集(Chicago Facial Dataset和CelebAMask-HQ)中提取图像,并由五名经过训练的标注者进行标注。该数据集的应用领域主要集中在眼科整形手术中的分割任务,旨在通过深度学习模型提高分割的准确性和临床实用性。
提供机构:
伊利诺伊大学芝加哥分校医学院
创建时间:
2024-09-30
AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建基于两个开源数据集:Chicago Facial Dataset (CFD) 和 CelebAMask-HQ Dataset (Celeb)。首先,从这两个数据集中选取包含眼睛的图像,并使用Mediapipe Facemesh进行裁剪,以确保仅包含眼周区域。随后,由五名经过训练的标注员使用Computer Vision Annotation Tool (CVAT)对图像中的虹膜、巩膜、眼睑、结膜和眉毛进行标注。为了确保标注质量,进行了内标注员和外标注员的可靠性验证,通过随机选取100张图像进行重复标注,并计算Dice分数以评估一致性。最终,共标注了2842张图像,所有标注数据均以COCO格式导出并进行后处理,确保每个解剖结构由特定的像素值表示。
特点
该数据集的显著特点在于其高精度的眼周解剖结构标注,涵盖了虹膜、巩膜、眼睑、结膜和眉毛等多个关键区域。通过内标注员和外标注员的验证,数据集展示了较高的标注一致性,平均Dice分数达到0.82。此外,数据集还提供了用于眼周距离预测的开源工具包,支持从分割掩码中计算眼周距离,进一步增强了其在临床应用中的实用性。所有模型权重和标注数据均公开可用,促进了社区的进一步研究和模型开发。
使用方法
该数据集适用于训练深度学习模型进行眼周区域的分割任务,特别适用于眼科和颅面外科的临床应用。用户可以通过下载公开的标注数据和模型权重,使用提供的开源工具包进行眼周距离的预测。具体使用方法包括:首先,加载预训练的DeepLabV3模型或自行训练的分割模型;其次,输入图像进行分割,获取眼周区域的分割掩码;最后,利用工具包计算眼周距离,如虹膜直径、巩膜显示、眼睑到虹膜距离等。此外,用户还可以通过API接口提交图像或分割掩码,直接获取眼周距离的计算结果,极大地方便了临床和研究中的应用。
背景与挑战
背景概述
在眼科领域,尽管已有多种开源数据集用于分类和分割任务,如光学相干断层扫描图像、眼底照片等,但针对外部眼部图像的深度学习训练数据集相对稀缺。特别是,现有的开源数据集主要用于生物识别和虹膜识别系统,缺乏针对眼科整形和颅面外科手术所需的详细眼周解剖标注。为了填补这一空白,George R. Nahass等人于2021年创建了Open-Source Periorbital Segmentation Dataset,旨在为眼科整形分割和眼周距离预测提供数据支持。该数据集整合了Chicago Facial Dataset和CelebAMask-HQ Dataset,通过五名训练有素的标注者对虹膜、巩膜、眼睑、结膜和眉毛进行详细标注,并验证了标注的一致性和模型的有效性。这一数据集的发布,标志着眼科整形和颅面外科领域在深度学习应用方面迈出了重要一步,为未来开发临床实用的分割网络奠定了基础。
当前挑战
尽管Open-Source Periorbital Segmentation Dataset在眼科整形和颅面外科领域具有重要意义,但其构建过程中仍面临诸多挑战。首先,数据集的标注过程复杂,需要五名标注者对每张图像进行详细标注,确保标注的一致性和准确性。其次,数据集的多样性受限于原始数据集的特性,如CelebAMask-HQ Dataset缺乏种族和性别元数据,可能影响模型的泛化能力。此外,尽管标注者在标注过程中表现出较高的一致性,但仍存在一定的主观性和变异性,特别是在标注较小的解剖结构时。最后,深度学习模型在眼睑和结膜的分割上表现相对较弱,表明模型仍有改进空间。这些挑战不仅影响了数据集的质量,也对未来模型的开发和应用提出了更高的要求。
常用场景
经典使用场景
在眼科应用领域,Open-Source Periorbital Segmentation Dataset 被广泛用于训练深度学习模型,以实现对眼周区域的精确分割。该数据集通过标注虹膜、巩膜、眼睑、结膜和眉毛等关键结构,为眼科整形手术中的分割任务提供了高质量的训练数据。通过使用该数据集,研究人员能够开发出能够准确预测眼周距离的算法,从而在临床实践中显著提高诊断和治疗的效率。
解决学术问题
Open-Source Periorbital Segmentation Dataset 解决了眼科领域中缺乏高质量眼周图像分割数据集的问题。传统上,眼科图像的分割主要依赖于内眼图像数据集,而对外眼图像的分割数据集则相对匮乏。该数据集通过提供详细的眼周解剖结构标注,填补了这一空白,使得研究人员能够更有效地开发和验证用于眼科整形和颅面手术的分割模型,从而推动了相关领域的学术研究进展。
衍生相关工作
基于 Open-Source Periorbital Segmentation Dataset,研究人员开发了多种用于眼周距离预测和疾病分类的深度学习模型。例如,一些研究工作利用该数据集训练的模型实现了对眼睑和眼周结构的高精度分割,并进一步用于自动化眼周距离的测量。此外,该数据集还促进了眼科整形手术中自动化诊断和治疗方案的制定,为临床实践提供了有力的技术支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

长江干流实时水位观测数据集(2024年)

该数据集为长江干流主要水文站实时水位观测数据集,包含了汉口、户口、九江、宜昌等16个水文站点的逐小时或逐日水位观测数据。 该数据集包含3个excel表格文件,长江干流站点.xls,逐日水位.xlsx,逐小时水位.xlsx。

国家地球系统科学数据中心 收录