RealQA

github2025-04-07 更新2025-04-09 收录

下载链接：

https://github.com/AMAP-ML/RealQA

下载链接

链接失效反馈

官方服务：

资源简介：

Realistic image Quality and Aesthetic (RealQA) 数据集包含14,715张用户生成内容（UGC）图像，每张图像标注有10个细粒度属性，涵盖低层次（如图像清晰度）、中层次（如主体完整性）和高层次（如构图）三个级别。

The Realistic image Quality and Aesthetic (RealQA) dataset consists of 14,715 user-generated content (UGC) images, each annotated with 10 fine-grained attributes covering three levels: low-level (e.g., image sharpness), mid-level (e.g., subject integrity), and high-level (e.g., composition).

创建时间：

2025-04-07

原始信息汇总

RealQA数据集概述

基本信息

数据集名称: RealQA (Realistic image Quality and Aesthetic)
数据集规模: 14,715张用户生成内容(UGC)图像
标注内容: 每张图像标注了10个细粒度属性
属性层级:
- 低层级 (如: 图像清晰度)
- 中层级 (如: 主体完整性)
- 高层级 (如: 构图)

研究背景

核心问题:
1. 单一评分难以捕捉人类感知的层次性
2. 如何利用多模态大语言模型(MLLMs)输出数值评分(如平均意见得分MOS)
应用领域: 图像质量评估(IQA)和图像美学评估(IAA)

主要贡献

提出了一种新方法: 通过预测两个额外有效数字，使next token范式达到SOTA性能
结合思维链(CoT)和学习到的细粒度属性，在5个公共IQA和IAA数据集上超越SOTA方法
在视频质量评估(VQA)中展现出强大的零样本泛化能力

当前状态

数据集尚未发布
检查点尚未发布
推理代码尚未发布
评估代码尚未发布
训练代码尚未发布

相关资源

论文链接: https://arxiv.org/pdf/2503.06141
SOTA排名: https://paperswithcode.com/sota/image-quality-assessment-on-koniq-10k

搜集汇总

数据集介绍

构建方式

在移动互联网快速发展的背景下，用户生成内容（UGC）图像数量激增，对其质量与美学的评估需求日益迫切。RealQA数据集应运而生，包含14,715张UGC图像，每张图像均标注了10个细粒度属性，涵盖低层次（如图像清晰度）、中层次（如主体完整性）和高层次（如构图）三个维度。通过深入探索多模态大语言模型（MLLMs）在预测数值分数方面的潜力，该数据集采用预测额外两位有效数字的策略，结合思维链（CoT）技术，显著提升了评估性能。

使用方法

该数据集为研究人员提供了全面的UGC图像评估基准。用户可通过加载标注文件获取图像及其对应的多层次属性评分，利用提供的预训练模型或自行开发的算法进行实验。对于MLLMs的应用，建议采用思维链技术结合细粒度属性预测，通过预测额外有效数字的方式优化数值评分输出。数据集支持端到端训练，也可用于零样本迁移学习，在保持原始分辨率的同时确保评估的准确性。

背景与挑战

背景概述

随着移动互联网的迅猛发展，用户生成内容（UGC）图像数量呈指数级增长，对UGC图像进行全面评估的需求日益迫切。在这一背景下，RealQA数据集应运而生，由研究团队于2024年提出，旨在通过多模态大语言模型（MLLMs）解决图像质量评估（IQA）和图像美学评估（IAA）中的关键问题。该数据集包含14,715张UGC图像，每张图像标注了10个细粒度属性，涵盖低层（如图像清晰度）、中层（如主体完整性）和高层（如构图）三个层次。RealQA的推出不仅填补了现有评估体系的空白，还为MLLMs在视觉感知任务中的应用提供了新的研究范式，显著提升了评估的准确性和可解释性。

当前挑战

RealQA数据集面临的挑战主要集中在两个方面：其一，人类感知具有层次化特性，单一的评分机制难以全面捕捉图像质量与美学的多维特征；其二，如何利用MLLMs输出数值化评分（如平均意见得分MOS）仍是一个开放性问题。在数据集构建过程中，研究团队需克服标注一致性与细粒度属性定义的复杂性，确保不同层次属性的准确划分与标注。此外，将MLLMs的生成能力转化为数值预测任务，需要探索创新的模型架构与训练策略，如通过预测额外有效数字或结合思维链（CoT）技术，以实现最优性能。

常用场景

经典使用场景

在图像质量评估领域，RealQA数据集凭借其丰富的细粒度标注和多层次感知特性，成为研究用户生成内容（UGC）图像评估的基准工具。该数据集最经典的应用场景在于验证多模态大语言模型（MLLMs）在预测图像质量和美学分数时的性能表现，特别是在模拟人类分层感知方面展现出独特优势。研究者通过该数据集能够深入探索从低层次清晰度到高层次构图等十个维度的综合评估方法。

解决学术问题

RealQA有效解决了图像评估领域两个关键科学问题：其一是突破了传统单一评分无法反映人类多层次感知的局限，通过十个细粒度属性构建了分层评估体系；其二是创新性地验证了MLLMs输出数值评分（如平均意见得分）的可行性，提出的'预测两个额外有效数字'方法在五个公开数据集上达到最先进水平。这些突破为理解人类视觉感知机制提供了新的量化研究范式。

实际应用

该数据集的实际价值在移动互联网内容管理领域得到充分体现，社交平台可基于其评估体系自动筛选优质UGC内容，视频平台能实现零样本迁移的视频质量评估。电商平台利用其细粒度属性分析商品图像的构图完整性和视觉吸引力，显著提升了用户购物体验。医疗影像领域也可借鉴其清晰度评估方法优化远程诊断图像质量。

数据集最近研究