five

aptos

收藏
Hugging Face2025-04-08 更新2025-04-09 收录
下载链接:
https://huggingface.co/datasets/bumbledeep/aptos
下载链接
链接失效反馈
官方服务:
资源简介:
亚太远程眼科协会(APTOS)数据集包含用于检测糖尿病视网膜病变的视网膜扫描图像。图像被调整大小为224x224像素,以便与多种预训练的深度学习模型兼容。该数据集由亚太远程眼科协会资助,由Sovit Ranjan Rath分享,并遵循MIT许可证。

The Asia Pacific Tele-Ophthalmology Society (APTOS) Dataset contains retinal scan images for diabetic retinopathy detection. All images have been resized to 224x224 pixels to ensure compatibility with various pre-trained deep learning models. This dataset was funded by the Asia Pacific Tele-Ophthalmology Society, shared by Sovit Ranjan Rath, and is released under the MIT License.
创建时间:
2025-04-06
搜集汇总
数据集介绍
main_image_url
构建方式
APTOS数据集源自亚太远程眼科学会(APTOS)举办的2019年盲症检测竞赛,由Aravind眼科医院的医疗团队在印度农村地区采集眼底图像。该数据集经过专业临床医师标注,根据糖尿病视网膜病变严重程度划分为0-4五个等级。原始图像经Sovit Ranjan Rath统一调整为224×224像素规格,便于直接适配主流深度学习模型。数据集包含3,662张训练图像,采用MIT许可协议开放使用。
特点
该数据集聚焦糖尿病视网膜病变这一重要公共卫生问题,其核心价值在于经过临床验证的专业标注体系。图像采用标准化预处理,确保与ImageNet等预训练模型的兼容性。五级分类体系(从无病变到增殖性病变)为研究提供了细粒度评估基准。值得注意的是,当前版本仅包含原始竞赛的训练集部分,且已进行尺寸归一化处理,这虽提升了易用性但可能损失部分原始图像细节。
使用方法
研究者可直接将该数据集用于糖尿病视网膜病变的二分类或多分类任务,224×224的标准化尺寸支持主流CNN架构的迁移学习。建议使用者自行划分训练/验证/测试集以评估模型性能。鉴于医疗数据的敏感性,建议结合临床知识进行数据增强以提升模型鲁棒性。使用时应充分注意数据集仅代表特定地域人群的局限性,必要时可结合原始竞赛的完整数据进行扩展研究。
背景与挑战
背景概述
APTOS数据集由亚太远程眼科学会(Asia Pacific Tele-Ophthalmology Society)于2019年发布,旨在通过视网膜扫描图像检测糖尿病视网膜病变的严重程度。该数据集由Aravind眼科医院的技术人员在印度农村地区采集,包含3662张经过预处理调整为224x224像素的视网膜图像。每张图像由临床医生根据病变严重程度标注为0至4级,分别对应无病变至增殖性糖尿病视网膜病变的不同阶段。这一数据集的建立为糖尿病视网膜病变的自动化诊断提供了重要资源,推动了计算机视觉在医疗影像分析领域的应用。
当前挑战
APTOS数据集面临的主要挑战包括两方面:在领域问题层面,糖尿病视网膜病变的早期诊断需要极高的分类精度,细微的病变特征可能导致分级错误,这对模型的敏感性和特异性提出了严峻考验;在数据构建层面,原始图像采集于医疗条件有限的农村地区,存在成像质量不均、光照条件不一致等问题,且数据规模相对有限,可能影响模型的泛化能力。此外,数据预处理中的降采样操作虽提高了计算效率,但也可能丢失部分关键病理特征,为后续分析带来潜在偏差。
常用场景
经典使用场景
在医学影像分析领域,APTOS数据集因其高质量的视网膜扫描图像而成为糖尿病视网膜病变(Diabetic Retinopathy, DR)检测研究的基准数据集。研究者通常利用该数据集训练深度学习模型,如卷积神经网络(CNN),以实现从轻度到增殖性DR的自动分级。其标准化的224x224像素尺寸设计,使得该数据集能够无缝适配多种预训练模型,极大促进了模型迁移学习的效率。
解决学术问题
APTOS数据集有效解决了医学影像分析中样本稀缺和标注标准化的关键问题。通过提供临床专家标注的视网膜图像,该数据集支持研究者开发高精度DR分级算法,填补了传统人工诊断效率低下的技术空白。其多类别标签体系(0-4级)为模型性能评估提供了细粒度标准,推动了计算机辅助诊断(CAD)技术在眼科疾病中的学术突破。
衍生相关工作
围绕APTOS数据集已衍生出多项里程碑式研究。Kaggle竞赛中涌现的U-Net变体和注意力机制模型,将DR检测准确率提升至95%以上。后续研究进一步结合生成对抗网络(GAN)进行数据增强,缓解了类别不平衡问题。MIT等机构基于该数据集开发的轻量化模型MobileDR,已成功应用于边缘计算设备,形成从学术到产业的完整技术链条。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作