xiaoqi-wang/miqd-2.5m

Name: xiaoqi-wang/miqd-2.5m
Creator: xiaoqi-wang
Published: 2026-04-30 14:38:19
License: 暂无描述

Hugging Face2026-04-30 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/xiaoqi-wang/miqd-2.5m

下载链接

链接失效反馈

官方服务：

资源简介：

MIQD-2.5M是一个大规模图像质量评估数据集，专为机器视觉任务设计。该数据集包含2.5百万张从10,000张原始图像生成的退化图像，涵盖图像分类（基于ImageNet）、目标检测（基于COCO）和实例分割（基于COCO）三种视觉任务。数据集包含10种失真类型，每种类型有5个失真级别和3种区域模式。使用75个不同的模型生成质量标签，并提供MMOS标签（包括一致性、准确性和综合评分）。数据集结构分为分类（miqa_cls）、检测（miqa_det）和分割（miqa_ins）三个子集，总大小约为984GB。

MIQD-2.5M is a large-scale image quality assessment dataset designed for machine vision tasks. The dataset contains 2.5 million degraded images generated from 10,000 original images, covering three vision tasks: image classification (based on ImageNet), object detection (based on COCO), and instance segmentation (based on COCO). It includes 10 distortion types, each with 5 levels of distortion and 3 region patterns. Quality labels are generated using 75 different models, and MMOS labels (including consistency, accuracy, and composite scores) are provided. The dataset is structured into three subsets: classification (miqa_cls), detection (miqa_det), and segmentation (miqa_ins), with a total size of approximately 984GB.

提供机构：

xiaoqi-wang

搜集汇总

数据集介绍

构建方式

MIQD-2.5M数据库的构建源于对机器视觉任务中图像质量评估的深度探索。研究团队从10,000张原始图像出发，系统性地施加了10种失真类型、5个失真等级和3种区域模式，共计生成250万张退化图像。这些图像覆盖了图像分类（ImageNet）、目标检测（COCO）和实例分割（COCO）三大视觉任务。为赋予每张图像质量标签，团队引入75种模型进行预测，并设计了多维度机器视觉质量评分体系（MMOS），该体系综合了任务准确率、预测一致性与复合评分，从而构建出规模庞大且标注精细的数据库。整个数据集按任务划分为miqa_cls、miqa_det和miqa_ins三个子集，并采用分卷压缩包形式发布，便于高效传输与解压。

特点

MIQD-2.5M数据集具有显著的规模与多样性优势。其250万张退化图像涵盖了丰富多样的失真类型与程度，并针对不同视觉任务和空间区域进行了精细设计，使得数据库能够全面模拟现实世界中图像退化的复杂场景。尤为突出的是，该数据集创新性地提出了MMOS标注范式，从任务准确率、预测一致性及复合评分三个维度衡量图像质量，摆脱了传统依赖人类主观评分的局限，更贴合机器视觉系统的实际需求。此外，数据集中实例分割与目标检测共享同一批图像，而分类与检测任务又各自拥有独立的标注，这种跨任务的数据结构为多任务学习与模型泛化研究提供了宝贵的资源。整个数据集体量约984GB，是目前该领域最大的公开数据库之一。

使用方法

MIQD-2.5M数据集的使用流程简洁而高效。首先，用户需从指定平台下载各子集对应的.tar.part_*分卷压缩包，通过Linux系统中的cat命令将它们合并为完整的tar文件。随后，为每个任务创建独立的目录（如miqa_cls），并使用tar -xf命令分别解压图像、标签、原始图像及附加信息等文件。其中，miqa_cls和miqa_det子集包含完整的图像与标注数据，而miqa_ins子集仅提供分割标签，其图像与检测子集共享。解压完成后，用户可根据任务需求直接读取图像与标注文件，用于训练、验证或测试机器视觉模型的质量评估能力。该数据集基于MIT协议开源，研究者可自由使用并引用相关论文进行学术探索。

背景与挑战

背景概述

随着机器视觉系统在图像分类、目标检测与实例分割等任务中的广泛应用，图像质量对模型性能的影响日益凸显。传统图像质量评估（IQA）主要面向人眼感知，而机器视觉对图像退化的敏感度与人类迥异，这催生了机器图像质量评估（MIQA）这一新兴研究方向。2025年，由中山大学王小琦、南洋理工大学张云与林维斯联合构建的MIQD-2.5M数据集应运而生。该数据集从1万张原始图像出发，系统生成250万张退化图像，覆盖10种失真类型、5个退化等级与3种区域退化模式，并引入多维度机器视觉评分（MMOS），整合了准确性、一致性与复合分等指标。研究团队动用75种模型标注质量标签，首次为机器视觉系统提供了大规模的、任务导向的IQA基准，对推动智能视觉系统鲁棒性设计具有里程碑意义。

当前挑战

数据集所解决的领域核心挑战在于现有IQA方法以人眼主观质量为尺度，缺乏针对机器视觉任务降质规律的精确建模；而构建过程中亦遭遇多重困难。首先，如何表征退化对机器任务性能的非线性影响是根本难题——同一失真在不同任务（如分类与分割）中的破坏模式迥异。其次，巨大规模（984GB）标注工程面临标注一致性挑战，需将75种模型在3种任务上输出的预测差异映射为统一质量分数（MMOS）。此外，区域退化模式的引入要求控制退化在图像前景、背景与兴趣区域间的交互效应，避免指标歧义。这些挑战共同塑造了MIQD-2.5M作为首个面向机器视觉的多任务、多模态图像质量评估数据集的独特学术价值。

常用场景

经典使用场景

在机器视觉系统的性能评估领域，MIQD-2.5M数据集被广泛用于机器图像质量评估（MIQA）任务的研究与基准测试。该数据集包含约250万张退化图像，源自10,000张原始图像，覆盖图像分类、目标检测和实例分割三大经典视觉任务。通过引入10种失真类型、5个退化等级以及3种区域退化模式，研究者能够系统性地探究不同失真条件对机器视觉任务准确性与稳定性的影响。其多维度质量标签（MMOS），包括任务精度、预测一致性及复合得分，为模型在设计面向机器感知的图像质量评价指标时提供了可靠的标注参考，从而成为开发与验证MIQA范式不可或缺的核心数据平台。

实际应用

在实际部署中，MIQD-2.5M数据集为自动驾驶、安防监控和工业质检等需要高可靠机器视觉系统的领域提供了关键支持。通过模拟实际成像链中可能出现的模糊、噪声、压缩伪影等退化情况，该数据集帮助开发者训练和筛选具有更高抗噪能力的目标检测与分割模型。其区域自适应退化建模能力（如ROI-DD与BG-DD模式）尤其适用于智能监控场景，使算法在前景破损与背景干扰并存的条件下依然保持稳健表现。此外，基于MMOS标签的模型可被集成到图像采集和处理管线中，实现动态质量监控与自适应性预处理，有效降低因图像质量劣化引发的系统误判风险。

衍生相关工作

围绕MIQD-2.5M数据集已衍生出一系列具有影响力的学术工作。同期发表的论文《Image Quality Assessment for Machines: Paradigm, Large-scale Database, and Models》系统阐述了面向机器的质量评价新框架，并基于该数据集验证了多种基线模型的有效性。研究者进一步开发了多种任务自适应评价模型，能够根据分类、检测或分割任务特点对退化图像进行排序与过滤。此外，利用MMOS标签，相关研究探索了质量驱动的数据增强策略，通过优先选取高质量样本或合成特定退化组合来提升训练效率。该数据集还催生了跨模型一致性分析的初步尝试，揭示了不同深度模型在相同退化条件下表现出的差异化脆弱性，为后续鲁棒性神经网络架构的优化提供了方向。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集