SEAGULL-100w

Hugging Face2024-11-20 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/Zevin2023/SEAGULL-100w

下载链接

链接失效反馈

官方服务：

资源简介：

SEAGULL-100w是一个大规模的合成ROI（感兴趣区域）基于图像质量评估（IQA）的数据集，包含通过六种不同的失真类型生成的失真图像。每种失真类型有20个不同的参数，总共生成了978,720张失真图像。数据集的结构包括失真图像和参考图像，失真图像按失真类型和参数分类存储。数据集的构建基于RAISE数据集，并使用了SAM和SEEM生成基于掩码的ROI，以及TOPIQ生成质量分数和重要性分数。

创建时间：

2024-11-18

原始信息汇总

SEAGULL-100w 数据集概述

基本信息

许可证: MIT
任务类别: 图像到图像
语言: 英语
数据集名称: SEAGULL-100w
数据集大小: 100B < n < 1T

简介

SEAGULL-100w 是一个大规模的合成 ROI 基于的 IQA 数据集，用于 "SEAGULL: No-reference Image Quality Assessment for Regions of Interest via Vision-Language Instruction Tuning."。

数据集包含六种不同的失真类型：模糊、锐度、曝光、对比度、色彩和压缩。每种失真类型有20个不同的参数，共生成 8156206=978,720 张失真图像。

数据结构

数据集结构如下：

SEAGULL-100w ├── Dist.Images │ ├── Blur │ │ ├── Blur_0 │ │ │ ├── id1.png │ │ │ ├── id2.png │ │ │ └── xxx │ │ ├── Blur_1 │ │ │ ├── id1.png │ │ │ ├── id2.png │ │ │ └── xxx │ │ └── xxx │ ├── Compression │ │ ├── Compression_0 │ │ │ ├── id1.png │ │ │ ├── id2.png │ │ │ └── xxx │ │ ├── Compression_1 │ │ │ ├── id1.png │ │ │ ├── id2.png │ │ │ └── xxx │ │ └── xxx │ └── xxx └── Ref.Images ├── id1.png ├── id2.png └── xxx

构建流程

数据集的构建流程包括生成失真图像和参考图像，具体流程图参见 Construction Pipeline。

致谢

数据集的构建基于以下资源：

引用

如果该数据集对您的研究有帮助，请引用以下论文：

@misc{chen2024seagullnoreferenceimagequality, title={SEAGULL: No-reference Image Quality Assessment for Regions of Interest via Vision-Language Instruction Tuning}, author={Zewen Chen and Juan Wang and Wen Wang and Sunhan Xu and Hang Xiong and Yun Zeng and Jian Guo and Shuxun Wang and Chunfeng Yuan and Bing Li and Weiming Hu}, year={2024}, eprint={2411.10161}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2411.10161}, }

搜集汇总

数据集介绍

构建方式

SEAGULL-100w数据集的构建过程基于大规模合成ROI（感兴趣区域）的图像质量评估需求。通过引入六种不同的失真类型，包括模糊、锐度、曝光、对比度、色彩丰富度和压缩，每种失真类型采用二十个不同的参数进行图像生成，最终形成了978,720张失真图像。数据集的构建还依赖于RAISE数据集作为基础，并结合了SAM和SEEM等先进技术生成基于掩码的ROI，同时利用TOPIQ工具生成ROI的质量评分和重要性评分。

特点

SEAGULL-100w数据集以其大规模和多样性著称，涵盖了六种失真类型及其多种参数组合，提供了丰富的图像质量评估场景。数据集不仅包含失真图像和参考图像，还提供了基于掩码的ROI及其语义标签，这些标签通过Osprey和ChatGPT-3.5生成，为相关领域的研究提供了额外的语义信息支持。此外，数据集还提供了快速查看版本，便于用户高效浏览和分析。

使用方法

SEAGULL-100w数据集的使用方法主要围绕图像质量评估任务展开。用户可以通过加载数据集中的失真图像和参考图像，结合提供的ROI掩码和语义标签，进行图像质量评分和ROI重要性分析。数据集的结构清晰，用户可根据需求选择不同失真类型和参数组合进行实验。此外，快速查看版本的文件便于用户快速获取关键信息，而详细的JSON文件则支持更深入的数据分析和模型训练。

背景与挑战

背景概述

SEAGULL-100w数据集由Zewen Chen等人于2024年提出，旨在通过视觉-语言指令调优实现无参考图像质量评估（No-reference Image Quality Assessment, NR-IQA）。该数据集基于ROI（Region of Interest）的大规模合成图像质量评估，包含六种失真类型（模糊、锐度、曝光、对比度、色彩丰富度和压缩），每种类型通过二十个不同参数生成失真图像，总计978,720张图像。SEAGULL-100w的构建依托于RAISE数据集，并借助SAM、SEEM和TOPIQ等工具生成掩码和评分。该数据集为图像质量评估领域提供了新的研究视角，尤其在ROI的语义描述和质量评分方面具有重要价值。

当前挑战

SEAGULL-100w数据集在解决图像质量评估问题时面临多重挑战。首先，ROI的语义描述和质量评分的生成依赖于复杂的视觉-语言模型，其准确性和一致性难以保证。其次，失真图像的质量评估需要处理多种失真类型的叠加效应，这对模型的鲁棒性和泛化能力提出了更高要求。在数据集构建过程中，如何高效生成大规模失真图像并确保其与真实场景的相似性也是一大难题。此外，数据集的标注和评分依赖于外部工具和模型，其性能和偏差可能影响最终结果的质量。这些挑战为后续研究提供了重要的改进方向。

常用场景

经典使用场景

SEAGULL-100w数据集在图像质量评估领域具有广泛的应用，特别是在无参考图像质量评估（No-reference Image Quality Assessment, NR-IQA）任务中。该数据集通过生成六种不同类型的失真图像，包括模糊、锐度、曝光、对比度、色彩丰富度和压缩，为研究者提供了丰富的实验材料。经典的使用场景包括利用这些失真图像训练和测试NR-IQA模型，以评估模型在不同失真条件下的表现。

实际应用

在实际应用中，SEAGULL-100w数据集可以用于开发自动图像质量评估系统，广泛应用于图像处理、计算机视觉和多媒体通信等领域。例如，在社交媒体平台中，自动评估用户上传图像的质量，以优化用户体验；在医学影像处理中，评估医学图像的质量，确保诊断的准确性；在视频监控系统中，实时评估监控图像的质量，提高监控系统的可靠性。

衍生相关工作

SEAGULL-100w数据集的发布推动了无参考图像质量评估领域的研究进展，衍生出多项经典工作。例如，基于该数据集的研究提出了新的视觉-语言指令调优方法，进一步提升了NR-IQA模型的性能。此外，该数据集还促进了图像分割、语义理解等相关领域的研究，如利用SAM和SEEM生成的掩码区域进行更精细的图像质量评估。这些工作不仅扩展了数据集的应用范围，也为图像质量评估领域提供了新的研究方向。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集