M2I和I2M

Name: M2I和I2M
Creator: AGH科技大学
Published: 2023-03-17 02:11:19
License: 暂无描述

arXiv2023-03-17 更新2024-06-21 收录

下载链接：

https://github.com/lifelonglab/M2I_I2M_benchmark

下载链接

链接失效反馈

官方服务：

资源简介：

M2I和I2M是由AGH科技大学等机构创建的持续学习基准数据集，包含从MNIST到TinyImageNet（M2I）和反向（I2M）的六个不同图像分类数据集。这些数据集涵盖了从简单到复杂的任务，旨在评估持续学习模型在动态环境中的鲁棒性。数据集通过GitHub公开，支持研究社区进行严格的可重复性评估，特别强调模型在不断学习新任务的同时避免遗忘旧知识的能力。

M2I and I2M are continual learning benchmark datasets developed by institutions including AGH University of Science and Technology. They comprise six distinct image classification datasets, with M2I following the sequence from MNIST to TinyImageNet and I2M adopting the reverse order. These datasets cover tasks ranging from simple to complex, and are intended to assess the robustness of continual learning models in dynamic environments. Publicly available via GitHub, the datasets enable rigorous reproducibility assessments within the research community, with a particular focus on the ability of models to continuously learn new tasks while avoiding catastrophic forgetting of previously acquired knowledge.

提供机构：

AGH科技大学

创建时间：

2023-03-17

搜集汇总

数据集介绍

构建方式

在持续学习领域，M2I和I2M数据集的构建旨在模拟真实世界中的复杂动态环境。该数据集通过整合六个异构图像分类数据集——包括MNIST、OMNIGLOT、Fashion MNIST、SVHN、CIFAR10和TinyImageNet——形成一系列任务。每个任务均包含十个类别，确保了评估指标的一致性与可解释性。数据预处理阶段，所有图像被统一调整为64×64像素，并将单通道黑白图像复制为三通道RGB格式，以维持输入的一致性。此外，每个类别均平衡抽取500张图像用于训练与评估，有效避免了类别不平衡对实验结果的影响。

特点

M2I和I2M数据集的核心特点在于其任务的高度异构性与复杂性梯度。这些任务涵盖了从简单黑白手写数字到复杂多领域自然图像的广泛视觉域，呈现出显著的分布偏移与质量差异。数据集特别设计了两种课程学习顺序：M2I遵循从简单到复杂的递增难度路径，而I2M则采用相反的递减顺序，从而能够系统评估模型在不同任务顺序下的泛化与遗忘行为。这种结构不仅增强了基准测试的挑战性，还为深入探究课程学习在持续学习中的作用提供了独特平台。

使用方法

使用M2I和I2M数据集时，研究者可基于Avalanche开源库实现高度可复现的实验流程。该数据集支持任务增量与类别增量两种经典持续学习场景，允许评估包括正则化、动态架构与经验回放在内的多种学习策略。评估过程采用严格的指标体系，如平均准确率、后向转移与前向转移，以全面衡量模型的泛化能力与遗忘程度。通过对比M2I和I2M不同任务顺序下的性能表现，能够深入分析课程学习对模型适应性与知识保留的影响，推动更鲁棒持续学习算法的开发。

背景与挑战

背景概述

在持续学习领域，现有评估基准往往局限于单一数据集或简化任务，难以反映现实场景的复杂性。M2I与I2M基准由Kamil Faber等学者于2023年提出，旨在构建一个涵盖六种异构图像数据集、按课程难度排序的评估框架。该基准通过整合MNIST、Omniglot、Fashion MNIST、SVHN、CIFAR10和TinyImageNet，模拟从简单手写数字到复杂自然图像的渐进学习过程，其核心在于系统化评估模型在动态环境中的知识积累与遗忘平衡能力，为持续学习研究提供了更贴近实际应用的标准化测试平台。

当前挑战

M2I与I2M基准致力于解决持续学习模型在异构任务序列中面临的灾难性遗忘与领域适应难题。其构建挑战主要体现在多维度异构数据整合上：需协调黑白与彩色图像、不同分辨率及领域分布差异，确保任务间复杂度梯度合理；同时需设计严谨的评估协议，统一各类任务为十分类设置以保障指标可比性，并克服课程顺序对度量解释性的干扰。这些挑战共同推动了对模型跨任务泛化与知识迁移能力的深度检验。

常用场景

经典使用场景

在持续学习领域，M2I和I2M数据集被设计为评估模型在动态环境中适应新任务同时保留旧知识能力的基准。其经典使用场景涉及将六个异构图像数据集（如MNIST、Omniglot、Fashion MNIST、SVHN、CIFAR10和TinyImageNet）按复杂度递增（M2I）或递减（I2M）顺序组织成任务序列，模拟真实世界从简单到复杂或反之的学习过程。这一设置使研究者能够系统测试模型在面临分布偏移、任务异质性和课程顺序影响时的稳健性，尤其关注模型在类增量和任务增量学习场景下的表现。

解决学术问题

该数据集解决了持续学习研究中评估协议碎片化与基准过于简化的问题。传统基准常局限于单一数据集或同质任务，难以真实反映模型在复杂动态环境中的泛化与遗忘行为。M2I和I2M通过整合多源异构数据、控制任务复杂度差异、引入课程学习顺序，并采用严谨的评估指标（如平均精度、前后向传递），为衡量模型抗灾难性遗忘能力、知识迁移效率及课程顺序利用效果提供了标准化框架。其意义在于推动了持续学习评估向更贴近现实场景的复杂性与严谨性演进，促进了模型比较的公平性与可复现性。

衍生相关工作

基于M2I和I2M数据集，研究者已开展多项经典工作，深入探索持续学习策略在复杂基准下的局限性。例如，对弹性权重巩固、梯度情景记忆等主流方法的系统性评估揭示了其在异构任务序列中抗遗忘能力的不足；同时，针对课程顺序效用的分析催生了新型策略设计，如利用任务相似性增强知识迁移的算法。这些工作不仅丰富了持续学习理论，还推动了如Avalanche等开源工具库的集成与应用，为后续研究提供了可扩展的实验基础与比较标准。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集