five

MAPLES-DR|糖尿病视网膜病变数据集|医学影像分析数据集

收藏
github2024-05-15 更新2024-05-31 收录
糖尿病视网膜病变
医学影像分析
下载链接:
https://github.com/LIV4D/MAPLES-DR
下载链接
链接失效反馈
资源简介:
MAPLES-DR数据集提供了198张MESSIDOR图像的DR和ME诊断以及10个视网膜结构的像素级分割图。该数据集旨在用于糖尿病视网膜病变的可解释筛查。

The MAPLES-DR dataset offers 198 MESSIDOR images with DR and ME diagnoses, along with pixel-level segmentation maps of 10 retinal structures. This dataset is designed for interpretable screening of diabetic retinopathy.
创建时间:
2023-12-16
原始信息汇总

MAPLES-DR 数据集概述

MAPLES-DR(MESSIDOR 解剖和病理标签用于可解释的糖尿病视网膜病变筛查)是一个公开数据集,提供了198张MESSIDOR图像的DR和ME诊断以及10个视网膜结构的像素级分割图。

数据集内容

  • 诊断信息:提供DR和ME的诊断。
  • 分割图:包含10个视网膜结构的像素级分割。
  • 图像来源:数据集不包含原始眼底图像,需从MESSIDOR Consortium的网站下载。

数据集获取

  • 下载地址:数据集可通过Figshare下载。

引用信息

  • 引用文献:若在学术工作中使用此数据集,请引用以下文献: bibtex @article{maples_dr, title={MAPLES-DR: MESSIDOR Anatomical and Pathological Labels for Explainable Screening of Diabetic Retinopathy}, author={Gabriel Lepetit-Aimon and Clément Playout and Marie Carole Boucher and Renaud Duval and Michael H Brent and Farida Cheriet}, year={2024}, eprint={2402.04258}, archivePrefix={arXiv}, doi={10.48550/arXiv.2402.04258} }

使用工具

  • Python库:提供maples_dr Python库,用于简化数据集的下载和使用。
    • 安装命令: bash pip install maples-dr

    • 示例用法: python import maples_dr train_set = maples_dr.load_train_set() test_set = maples_dr.load_test_set()

示例和文档

  • 示例Notebooks:包含在examples/目录中,展示如何使用maples_dr Python库。
  • 详细文档:提供关于配置图像分辨率和格式、包含眼底图像与标签等高级功能的详细信息。

致谢

  • 贡献者:感谢多位专家在标注MAPLES-DR数据集上的贡献。
  • 资助:此研究由加拿大自然科学与工程研究委员会、Diabetes Action Canada和FROUM资助。
  • 原始数据来源:感谢Messidor项目合作伙伴提供的原始MESSIDOR数据集。
AI搜集汇总
数据集介绍
main_image_url
构建方式
MAPLES-DR数据集的构建基于MESSIDOR数据集,通过专业医疗人员的细致标注,为198张眼底图像提供了糖尿病视网膜病变(DR)和黄斑水肿(ME)的诊断信息,以及10种视网膜结构的像素级分割图。这一过程确保了数据集的高质量和临床相关性,为机器学习应用提供了丰富的标注数据。
特点
MAPLES-DR数据集的显著特点在于其高精度的像素级分割图和详细的病理诊断信息,这些信息为解释性筛查糖尿病视网膜病变提供了坚实的基础。此外,数据集的结构化设计使得其易于集成到机器学习模型中,支持多种应用场景,如疾病筛查和病理分析。
使用方法
使用MAPLES-DR数据集时,用户可以通过`maples_dr` Python库轻松下载和加载数据。该库支持自动下载、解压和本地缓存数据集,并提供简单的API接口以访问训练集和测试集。用户还可以选择将数据导出到本地文件夹,以便进行进一步的分析和处理。详细的文档和示例代码进一步简化了数据集的使用流程。
背景与挑战
背景概述
MAPLES-DR数据集,全称为MESSIDOR Anatomical and Pathological Labels for Explainable Screening of Diabetic Retinopathy,是由Gabriel Lepetit-Aimon及其团队在2024年创建的公开数据集。该数据集专注于糖尿病视网膜病变(Diabetic Retinopathy, DR)的筛查与解释,提供了198张MESSIDOR数据集图像的DR和ME诊断,以及10种视网膜结构的像素级分割图。MAPLES-DR的开发旨在通过提供详细的解剖和病理标签,推动机器学习在眼科疾病筛查中的应用,特别是在解释性筛查方面。该数据集的发布对眼科医学和计算机视觉领域具有重要影响,为研究人员提供了一个标准化的工具,以开发和验证新的诊断算法。
当前挑战
MAPLES-DR数据集在构建过程中面临多项挑战。首先,像素级分割图的生成需要高度专业化的医学知识和精细的技术,以确保分割的准确性和可靠性。其次,数据集的标注工作涉及多位专家的参与,确保了标注的一致性和质量,但也增加了数据集构建的复杂性和成本。此外,数据集的规模相对较小,仅包含198张图像,这在一定程度上限制了其在深度学习模型训练中的应用。最后,数据集的发布和维护需要持续的技术支持和更新,以适应不断发展的研究需求和技术进步。
常用场景
经典使用场景
在眼科医学领域,MAPLES-DR数据集的经典使用场景主要集中在糖尿病视网膜病变(DR)和黄斑水肿(ME)的诊断与解释性筛查。该数据集提供了198张眼底图像的像素级分割图,涵盖了10种视网膜结构,为机器学习模型在DR和ME的自动检测与分类提供了丰富的标注数据。通过这些标注,研究人员可以开发和验证基于深度学习的诊断算法,从而提高筛查效率和准确性。
实际应用
在实际应用中,MAPLES-DR数据集被广泛用于开发和优化糖尿病视网膜病变和黄斑水肿的自动筛查系统。这些系统可以部署在眼科诊所和医院,帮助医生快速、准确地评估患者的视网膜健康状况,从而及时进行干预和治疗。此外,该数据集还支持远程医疗应用,使得偏远地区的患者也能享受到高质量的眼科筛查服务,显著提升了医疗资源的可及性和效率。
衍生相关工作
基于MAPLES-DR数据集,研究者们开展了一系列相关工作,包括但不限于开发新的深度学习模型、优化图像分割算法以及评估不同模型的性能。例如,有研究利用该数据集训练卷积神经网络(CNN),以提高病变检测的准确性;还有研究通过对比不同分割算法的性能,提出了改进的分割方法。这些工作不仅推动了眼科医学的自动化进程,也为其他医学图像分析领域提供了宝贵的经验和方法。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

河湖“清四乱”监测

通过卫星遥感技术,对河流、湖泊、坑塘、水库等现状情况及变化趋势进行监测,对目标水域的水体富营养化、总磷、总氮等水质指标进行反演,对水利工程实施和建设进度进行跟踪监测,对河湖“四乱”行为进行监测排查,帮助用户快速掌握水域面积和水质变化情况、水利工程设施的建设进展情况以及追溯河湖“四乱”整治情况。

上海数据交易所登记层 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

PCLT20K

PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。

arXiv 收录