Angelou0516/COph100
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/Angelou0516/COph100
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含100名婴儿眼睛(患有早产儿视网膜病变)的全面眼科眼底图像数据集,最初用于视网膜图像配准。当前版本是为EasyMedSeg重新打包的分割导向版本。每个样本包含一张640x480 RGB的眼底照片(RetCam拍摄)和一个自动生成的视网膜血管二进制掩码。掩码由Hu等人使用在FIVES数据集上训练的SS-MAF模型生成(论文报告的Dice得分为91.56%)。100只眼睛来自接受ROP筛查的婴儿,每只眼睛在2-9个检查会话中拍摄。当前parquet文件包含324个(图像,掩码)会话。
This is the segmentation-oriented re-packaging of COph100 for EasyMedSeg. Each sample is a fundus photograph (640x480 RGB, RetCam) paired with an automatically generated binary retinal-vessel mask. The mask was produced by Hu et al. using an SS-MAF model trained on FIVES (paper-reported 91.56% Dice on FIVES test set). The 100 eyes come from infants screened for ROP; each eye was photographed across 2-9 examination sessions. The current parquet contains 324 (image, mask) sessions.
提供机构:
Angelou0516
搜集汇总
数据集介绍

构建方式
COph100数据集专为视网膜图像分割任务而构建,其原始来源为100名早产儿视网膜病变筛查中婴儿的100只眼底图像。数据集中的每份样本皆为640×480像素的彩色眼底照片,并配有一张自动生成的二值视网膜血管掩模。该掩模由Hu等人基于SS-MAF模型在FIVES数据集上训练后自动预测产生(在该测试集上报告的Dice系数达91.56%)。所有眼底照片来自不同检查阶段的2至9次检查,最终形成了324对图像与掩模的样本集合,并以parquet格式重新组织发布。
特点
该数据集涵盖了100只患眼的多阶段检查数据,支持对个体眼睛在不同时间点的血管结构变化进行纵向分析。每张图像不仅包含分割掩模,还保留了原始的10个手动控制点对(以LabelMe JSON格式存储),这使得数据集同时适用于图像配准与分割研究。掩模为模型生成的软标注,虽非人工标注,但基于强大的深度分割模型,具有较高的语义一致性。此外,数据集明确区分了受试者ID、眼睛ID、检查次数与帧索引,结构化程度高,便于数据检索与实验划分。
使用方法
使用者可通过HuggingFace Datasets库直接加载该数据集,默认配置下将返回包含图像、掩模及元数据的样本。由于数据集已划分为单一测试集,适合直接用于分割模型的评估或配准任务的验证。对于分割任务,建议将二值掩模作为弱监督训练目标;对于配准任务,可以利用control_points字段中的控制点对进行点引导的图像对齐。研究者也可根据subject_id与session字段独立划分数据子集,构建个性化的交叉验证或纵向分析流程。数据遵循CC BY 4.0许可,可自由使用并引用原始论文与数据源。
背景与挑战
背景概述
COph100数据集诞生于2025年,由胡宇晨、龚明昊、邱志超等研究人员构建,旨在为视网膜图像配准提供一套全面的婴儿眼底影像资源。该数据集涵盖100只患有早产儿视网膜病变(ROP)的婴儿眼睛,包含324个配对样本,每张眼底图像(640×480像素,RetCam拍摄)均附有自动生成的二进制视网膜血管掩膜。作为RIDIRP数据库的组成部分,COph100填补了婴幼儿眼底影像数据集稀缺的空白,为ROP筛查、病情监测及眼动追踪研究提供了关键基准,其发表于《Scientific Data》的论文彰显了该数据集在医学影像分析领域的影响力,推动了早产儿视网膜病变自动化诊断技术的发展。
当前挑战
COph100所解决的领域挑战在于婴幼儿眼底血管分割与图像配准的困难性:婴幼儿眼球未完全发育,图像对比度低、血管纤细且存在不均匀光照,加之ROP导致的血管扭曲和新生血管,使传统算法难以准确识别。在构建过程中,研究人员面临两大挑战:一是数据采集的复杂性,需在不同时间点(2至9次检查)对同一只眼睛进行跟踪,涉及视网膜发育的动态变化;二是血管掩膜标注的困难,该数据集采用了基于SS-MAF模型的自动分割方法,而非人工标注,这虽提高了效率,但模型生成的掩膜可能引入系统性偏差,需谨慎作为软地面真值使用。
常用场景
经典使用场景
COph100数据集在眼科医学影像分析领域,最经典的使用场景是婴幼儿视网膜血管的分割任务。该数据集包含100只患有早产儿视网膜病变(ROP)的婴儿眼睛的眼底图像,每幅图像均配备由SS-MAF模型自动生成的二值视网膜血管掩膜。研究者可借助这些高分辨率(640x480 RGB)的眼底照片与对应掩膜,训练和验证深度学习模型在复杂病理条件下的血管分割性能,尤其针对ROP特有的血管扭曲、增生等异常形态,为后续临床诊断提供精准的形态学量化基础。
衍生相关工作
COph100数据集衍生出一系列推动视网膜影像分析领域发展的经典工作。其母体研究——由Hu等人提出的SS-MAF模型,在FIVES数据集上实现了91.56%的Dice系数,为生成该数据集的血管掩膜提供了核心技术支撑。此外,数据集中包含的10个手动控制点对(control_points)为图像配准任务提供了宝贵的基准,催生了面向ROP的眼底图像配准算法研究。围绕该数据集,后续工作可能聚焦于跨域分割适应、少样本学习以及多任务联合优化(如同时进行分割与配准),进一步拓宽了其在计算机辅助眼科诊断中的学术与应用价值。
数据集最近研究
最新研究方向
COph100数据集聚焦于早产儿视网膜病变(ROP)的眼底图像分割与配准研究,其最新方向涵盖基于深度学习模型的视网膜血管自动分割、多模态图像配准以及临床辅助诊断。该数据集由100名ROP患儿的324次检查会话构成,提供640x480的眼底照片及自动生成的血管掩膜,结合SS-MAF等先进模型实现高精度分割(Dice达91.56%)。当前研究热点包括利用控制点进行图像配准、探索模型生成掩膜作为弱监督标签的可靠性,以及推动ROP筛查的自动化与标准化。该数据集的发布显著促进了儿科眼科影像分析的前沿进展,为早期干预和治疗评估提供了关键数据支撑,具有重要的临床转化意义。
以上内容由遇见数据集搜集并总结生成



