MedMNIST-C
收藏MedMNIST-C 数据集概述
数据集简介
MedMNIST-C 是一个基于 MedMNIST+ 集合的基准数据集,涵盖了 12 个 2D 数据集和 9 种成像模式。该数据集模拟了任务和模式特定的图像损坏,以全面评估现有算法对 现实世界缺陷 和 分布偏移 的鲁棒性。此外,简单易用的人工损坏允许进行高性能、轻量级的 数据增强,以增强模型鲁棒性。
主要组件
medmnistc/corruptions/registry.py: 包含所有损坏及其相关强度超参数的列表。medmnistc/dataset_manager.py: 负责创建损坏数据集的数据集类。medmnistc/visualizer.py: 用于可视化和存储定义的损坏的类。medmnistc/augmentation.py: 基于定义的损坏的数据增强类。medmnistc/dataset.py: 用于损坏数据集的数据集类。medmnistc/eval.py: 用于在损坏数据集下进行模型评估的 PyTorch 类。medmnistc/assets/baseline/*: 用于在损坏数据集下进行模型评估的归一化基准。
基本用法
创建损坏数据集
python from medmnistc.dataset_manager import DatasetManager
medmnist_path = ... # 清洁图像的路径 medmnistc_path = ... # 损坏图像的路径
ds_manager = DatasetManager(medmnist_path=medmnist_path, output_path=output_path) ds_manager.create_dataset(dataset_name="breastmnist") # 创建单个损坏的测试集 ds_manager.create_dataset(dataset_name="all") # 创建所有
数据增强
python from medmnistc.augmentation import AugMedMNISTC from medmnistc.corruptions.registry import CORRUPTIONS_DS import torchvision.transforms as transforms
dataset = "breastmnist" # 选择数据集 train_corruptions = CORRUPTIONS_DS[dataset] # 加载该数据集的设计损坏 images = ... # 加载图像
使用 AugMedMNISTC 进行增强
augment = AugMedMNISTC(train_corruptions) augmented_img = augment(images[0])
集成到 transforms.Compose
aug_compose = transforms.Compose([ AugMedMNISTC(train_corruptions), transforms.ToTensor(), transforms.Normalize(mean=..., std=...) ])
augmented_img = aug_compose(images[0])
许可证
代码采用 Apache-2.0 License。
MedMNIST-C 数据集采用 Creative Commons Attribution 4.0 International (CC BY 4.0) 许可证,除了 DermaMNIST-C 采用 Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) 许可证。
引用
如果该工作对您有帮助,请考虑引用我们:
@article{disalvo2024medmnist, title={MedMNIST-C: Comprehensive benchmark and improved classifier robustness by simulating realistic image corruptions}, author={Di Salvo, Francesco and Doerrich, Sebastian and Ledig, Christian}, journal={arXiv preprint arXiv:2406.17536}, year={2024} }

- 1MedMNIST-C: Comprehensive benchmark and improved classifier robustness by simulating realistic image corruptions巴伐利亚大学xAILab Bamberg · 2024年



