SEAGULL-100w
收藏SEAGULL 数据集概述
数据集简介
SEAGULL 数据集专注于图像质量评估(IQA)中的感兴趣区域(ROI)质量分析。现有方法主要针对整体图像质量进行分析,而 SEAGULL 则探索了 ROI 质量分析,为图像质量改进提供细粒度指导。SEAGULL 结合了视觉语言模型(VLM)、Segment Anything Model(SAM)生成的掩码以及精心设计的基于掩码的特征提取器(MFE),以提取全局和局部令牌,从而实现对指定 ROI 的准确细粒度 IQA。
数据集组成
SEAGULL 数据集包含两个子数据集:
- SEAGULL-100w: 包含约 100 万张合成失真图像,包含 3300 万个 ROI,用于预训练以提高模型对区域质量感知的性能。
- SEAGULL-3k: 包含约 3000 个真实失真 ROI,用于增强模型对真实世界失真的感知能力。
数据集发布
- SEAGULL-100w: 已于 2024 年 11 月 25 日公开发布,可在 Hugging Face 和 Baidu Network 获取。
未来计划
- 发布在线演示
- 发布模型检查点和推理代码
- 发布训练代码
- 发布 SEAGULL-3k 数据集
引用
如果 SEAGULL 数据集对您的研究有帮助,请引用以下论文:
@misc{chen2024seagullnoreferenceimagequality, title={SEAGULL: No-reference Image Quality Assessment for Regions of Interest via Vision-Language Instruction Tuning}, author={Zewen Chen and Juan Wang and Wen Wang and Sunhan Xu and Hang Xiong and Yun Zeng and Jian Guo and Shuxun Wang and Chunfeng Yuan and Bing Li and Weiming Hu}, year={2024}, eprint={2411.10161}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2411.10161}, }




