miqd-2.5m

Hugging Face2026-04-30 更新2026-05-01 收录

下载链接：

https://huggingface.co/datasets/xiaoqi-wang/miqd-2.5m

下载链接

链接失效反馈

官方服务：

资源简介：

MIQD-2.5M 是一个用于机器视觉任务的大规模图像质量评估数据集，包含 250 万张从 10,000 张原始图像生成的退化图像。数据集支持三种视觉任务：图像分类（基于 ImageNet）、目标检测（基于 COCO）和实例分割（基于 COCO）。每张图像经过 10 种失真类型、5 个失真级别和 3 种区域模式的组合处理，并采用 75 种模型生成质量标签。数据集标注包括准确性（任务性能）、一致性（预测稳定性）和综合评分（MMOS）。数据集结构分为三个主要部分：miqa_cls（图像分类）、miqa_det（目标检测）和 miqa_ins（实例分割），每个部分包含图像、标签、源图像和附加信息。数据集总大小约为 984 GB，适用于图像质量评估、机器视觉基准测试等任务。

创建时间：

2026-04-24

原始信息汇总

数据集概述：MIQD-2.5M

MIQD-2.5M 是一个面向机器视觉图像质量评估的大规模基准数据库。

核心信息

数据集名称：MIQD-2.5M Dataset
许可证：MIT
任务类型：图像分类、目标检测
数据集大小：约 984 GB
相关资源：论文、代码

数据集规模与构成

2,500,000 张退化图像，源自 10,000 张原始图像。
覆盖 3 个视觉任务：
- 图像分类（ImageNet）
- 目标检测（COCO）
- 实例分割（COCO）
包含 10 种失真类型 × 5 个等级 × 3 种区域模式。
使用 75 个模型生成质量标签。

标注体系（MMOS）

每张图像包含以下标注：

准确性（Accuracy）：任务性能。
一致性（Consistency）：预测稳定性。
综合得分（Composite/MMOS）。

数据集结构

MIQD_2.5M/ ├── miqa_cls/ # 图像分类 │ ├── images/ # 退化图像 │ ├── labels/ # 标签 │ ├── src_images/ # 原始图像 │ └── additional_info/ # 附加信息 ├── miqa_det/ # 目标检测 │ ├── images/ │ ├── labels/ │ ├── src_images/ │ └── additional_info/ └── miqa_ins/ # 实例分割 └── labels/ # 标签（共享检测任务的图像）

注意事项

实例分割任务与检测任务共享图像，但各有任务特定的标签。
数据集以 .tar.part_* 分卷压缩包形式提供，需合并后解压使用。

搜集汇总

数据集介绍

构建方式

MIQD-2.5M数据集由中山大学与南洋理工大学联合构建，旨在推动面向机器的图像质量评估研究。该数据集从10,000张原始图像出发，通过引入10种失真类型、每种失真设置5个等级，并结合3种区域退化模式（全局、感兴趣区域、背景区域），系统性地生成了250万张退化图像。为了生成质量标签，研究团队部署了75种不同的视觉模型，覆盖图像分类（ImageNet）、目标检测与实例分割（COCO）三类视觉任务，并设计了一套多指标联合标注体系（MMOS），为每张图像标注了准确性、一致性及综合分数，从而构建了一个层次分明、任务导向的大规模数据库。

使用方法

使用MIQD-2.5M数据集时，用户需从HuggingFace下载分卷压缩包，按任务类型（分类、检测、分割）分别合并与解压。每个子集内部，图像存放于'images'目录，标签存于'labels'目录，原始图像位于'src_images'目录，附加信息则存储在'additional_info'中。实例分割子集与检测子集共享图像，但标签内容因任务而异。用户可根据自身需求，加载对应子集的图像与标签文件进行模型训练或评估，同时利用MMOS标注中的准确性、一致性与综合分数作为监督信号，开发面向机器的图像质量评估模型。数据集采用MIT协议开源，便于学术交流与工业应用。

背景与挑战

背景概述

在计算机视觉领域，图像质量显著影响机器视觉任务的性能，然而传统图像质量评估（IQA）方法多基于人类感知，难以准确反映机器对图像质量的真实需求。为填补这一空白，Xiaoqi Wang、Yun Zhang及Weisi Lin等研究者于2025年提出了MIQD-2.5M（Machine Image Quality Database），该数据集由中山大学与南洋理工大学联合构建，旨在系统性地研究图像质量对机器视觉任务的影响。其核心研究问题聚焦于如何量化机器对图像质量的偏好，并建立一套适用于机器视觉任务的评估范式。该数据集涵盖图像分类、目标检测与实例分割三大核心任务，通过大规模退化图像与多维度质量标签，为机器视觉领域的质量评估研究提供了坚实的基准，对推动相关算法的发展具有重要影响力。

当前挑战

该数据集所解决的领域挑战在于，传统IQA指标如PSNR、SSIM等与机器视觉任务性能之间缺乏明确关联，难以指导实际应用中图像质量的优化。MIQD-2.5M通过引入MMOS（多任务质量分数）标签，从准确性、一致性与复合分数三个维度，构建了面向机器视觉任务的图像质量评估新范式，克服了原有评价体系与机器需求脱节的问题。在构建过程中，数据集面临两大挑战：一是需从10,000张原始图像生成2.5M张退化图像，涵盖10种失真类型与5个退化等级，并针对每张图像设定不同的区域退化模式（如全局、感兴趣区域、背景区域），以确保数据多样性与任务适配性；二是需调用75种机器模型为每张图像生成质量标签，涉及大规模计算资源与复杂的标签一致性校验，对数据构建的效率与可靠性提出了极高要求。

常用场景

经典使用场景

MIQD-2.5M数据集是面向机器视觉图像质量评估（Machine Vision Image Quality Assessment, MIQA）的超大规模基准数据库。其经典使用场景在于系统性地量化失真图像对下游视觉任务性能的影响，涵盖图像分类（ImageNet）、目标检测（COCO）和实例分割（COCO）三大核心任务。研究者可利用该数据库探究不同失真类型（如噪声、模糊、压缩等）、失真程度及区域失真模式（全局、区域目标、区域背景）如何影响机器感知和任务精度，从而构建更鲁棒的视觉系统。

解决学术问题

该数据集有效解决了传统图像质量评估研究长期局限于人类主观感知、而忽略机器任务需求这一根本性学术问题。它引入多模态任务导向的评估范式（MMOS），通过精确标注每张失真图像在指定视觉任务上的准确率（Accuracy）、一致性（Consistency）和复合分数（Composite），揭示了图像退化与机器性能之间的复杂映射关系。这一开创性工作推动了从人类中心向机器中心的IQA范式转变，为构建任务感知的视觉系统提供了全新理论框架和数据支撑。

实际应用

在实际应用中，MIQD-2.5M为各类机器视觉系统的质量监控与优化提供了直接工具。例如，在安防监控领域，可用于评估不同环境退化下目标检测模型的可靠性；在自动驾驶场景中，可量化道路图像失真对车辆识别与分割的影响，指导传感器选择与图像预处理策略。此外，该数据库支持对图像压缩、传输等环节进行任务导向的质量评估，助力通信系统在带宽约束下最小化对下游视觉任务的性能损失，具有广泛工业应用价值。

数据集最近研究