Angelou0516/COph100

Name: Angelou0516/COph100
Creator: Angelou0516
Published: 2026-05-02 00:19:30
License: 暂无描述

Hugging Face2026-05-02 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/Angelou0516/COph100

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个包含100名婴儿眼睛（患有早产儿视网膜病变）的全面眼科眼底图像数据集，最初用于视网膜图像配准。当前版本是为EasyMedSeg重新打包的分割导向版本。每个样本包含一张640x480 RGB的眼底照片（RetCam拍摄）和一个自动生成的视网膜血管二进制掩码。掩码由Hu等人使用在FIVES数据集上训练的SS-MAF模型生成（论文报告的Dice得分为91.56%）。100只眼睛来自接受ROP筛查的婴儿，每只眼睛在2-9个检查会话中拍摄。当前parquet文件包含324个（图像，掩码）会话。

This is the segmentation-oriented re-packaging of COph100 for EasyMedSeg. Each sample is a fundus photograph (640x480 RGB, RetCam) paired with an automatically generated binary retinal-vessel mask. The mask was produced by Hu et al. using an SS-MAF model trained on FIVES (paper-reported 91.56% Dice on FIVES test set). The 100 eyes come from infants screened for ROP; each eye was photographed across 2-9 examination sessions. The current parquet contains 324 (image, mask) sessions.

提供机构：

Angelou0516

搜集汇总

数据集介绍

构建方式

COph100数据集专为视网膜图像分割任务而构建，其原始来源为100名早产儿视网膜病变筛查中婴儿的100只眼底图像。数据集中的每份样本皆为640×480像素的彩色眼底照片，并配有一张自动生成的二值视网膜血管掩模。该掩模由Hu等人基于SS-MAF模型在FIVES数据集上训练后自动预测产生（在该测试集上报告的Dice系数达91.56%）。所有眼底照片来自不同检查阶段的2至9次检查，最终形成了324对图像与掩模的样本集合，并以parquet格式重新组织发布。

特点

该数据集涵盖了100只患眼的多阶段检查数据，支持对个体眼睛在不同时间点的血管结构变化进行纵向分析。每张图像不仅包含分割掩模，还保留了原始的10个手动控制点对（以LabelMe JSON格式存储），这使得数据集同时适用于图像配准与分割研究。掩模为模型生成的软标注，虽非人工标注，但基于强大的深度分割模型，具有较高的语义一致性。此外，数据集明确区分了受试者ID、眼睛ID、检查次数与帧索引，结构化程度高，便于数据检索与实验划分。

使用方法

使用者可通过HuggingFace Datasets库直接加载该数据集，默认配置下将返回包含图像、掩模及元数据的样本。由于数据集已划分为单一测试集，适合直接用于分割模型的评估或配准任务的验证。对于分割任务，建议将二值掩模作为弱监督训练目标；对于配准任务，可以利用control_points字段中的控制点对进行点引导的图像对齐。研究者也可根据subject_id与session字段独立划分数据子集，构建个性化的交叉验证或纵向分析流程。数据遵循CC BY 4.0许可，可自由使用并引用原始论文与数据源。

背景与挑战

背景概述

COph100数据集诞生于2025年，由胡宇晨、龚明昊、邱志超等研究人员构建，旨在为视网膜图像配准提供一套全面的婴儿眼底影像资源。该数据集涵盖100只患有早产儿视网膜病变（ROP）的婴儿眼睛，包含324个配对样本，每张眼底图像（640×480像素，RetCam拍摄）均附有自动生成的二进制视网膜血管掩膜。作为RIDIRP数据库的组成部分，COph100填补了婴幼儿眼底影像数据集稀缺的空白，为ROP筛查、病情监测及眼动追踪研究提供了关键基准，其发表于《Scientific Data》的论文彰显了该数据集在医学影像分析领域的影响力，推动了早产儿视网膜病变自动化诊断技术的发展。

当前挑战

COph100所解决的领域挑战在于婴幼儿眼底血管分割与图像配准的困难性：婴幼儿眼球未完全发育，图像对比度低、血管纤细且存在不均匀光照，加之ROP导致的血管扭曲和新生血管，使传统算法难以准确识别。在构建过程中，研究人员面临两大挑战：一是数据采集的复杂性，需在不同时间点（2至9次检查）对同一只眼睛进行跟踪，涉及视网膜发育的动态变化；二是血管掩膜标注的困难，该数据集采用了基于SS-MAF模型的自动分割方法，而非人工标注，这虽提高了效率，但模型生成的掩膜可能引入系统性偏差，需谨慎作为软地面真值使用。

常用场景

经典使用场景

COph100数据集在眼科医学影像分析领域，最经典的使用场景是婴幼儿视网膜血管的分割任务。该数据集包含100只患有早产儿视网膜病变（ROP）的婴儿眼睛的眼底图像，每幅图像均配备由SS-MAF模型自动生成的二值视网膜血管掩膜。研究者可借助这些高分辨率（640x480 RGB）的眼底照片与对应掩膜，训练和验证深度学习模型在复杂病理条件下的血管分割性能，尤其针对ROP特有的血管扭曲、增生等异常形态，为后续临床诊断提供精准的形态学量化基础。

衍生相关工作

COph100数据集衍生出一系列推动视网膜影像分析领域发展的经典工作。其母体研究——由Hu等人提出的SS-MAF模型，在FIVES数据集上实现了91.56%的Dice系数，为生成该数据集的血管掩膜提供了核心技术支撑。此外，数据集中包含的10个手动控制点对（control_points）为图像配准任务提供了宝贵的基准，催生了面向ROP的眼底图像配准算法研究。围绕该数据集，后续工作可能聚焦于跨域分割适应、少样本学习以及多任务联合优化（如同时进行分割与配准），进一步拓宽了其在计算机辅助眼科诊断中的学术与应用价值。

数据集最近研究