RAID-Database
收藏arXiv2024-12-13 更新2024-12-17 收录
下载链接:
https://github.com/paudauo/BBDD_Affine_Transformations
下载链接
链接失效反馈官方服务:
资源简介:
RAID-Database是由巴伦西亚大学和海梅一世大学等机构创建的一个用于研究人类对仿射图像畸变响应的数据集。该数据集包含888张图像,其中包括24张参考图像和864张经过旋转、平移、缩放和添加高斯噪声处理的畸变图像。数据集的创建过程采用了经典的MLDS(最大似然差异缩放)方法,确保了数据的质量和一致性。该数据集主要用于图像质量评估和人类视觉模型的研究,旨在解决现有数据集在自然条件下畸变研究的不足。
The RAID-Database is a dataset developed by institutions including the University of Valencia and Universitat Jaume I, aimed at investigating human responses to affine image distortions. It contains a total of 888 images, comprising 24 reference images and 864 distorted images that have undergone processing such as rotation, translation, scaling, and the addition of Gaussian noise. The dataset was constructed using the classic MLDS (Maximum Likelihood Difference Scaling) methodology, which ensures the quality and consistency of the data. It is primarily used for research on image quality assessment and human visual models, with the objective of addressing the shortcomings of existing datasets in the study of distortions under naturalistic conditions.
提供机构:
巴伦西亚大学, 海梅一世大学, 新成像技术研究所, 卡斯特利翁数学研究所
创建时间:
2024-12-13
原始信息汇总
BBDD_Affine_Transformations
- 数据集名称: BBDD_Affine_Transformations
- 数据集描述: 该数据集包含图像的仿射变换。
- 数据集链接: Link to the images
搜集汇总
数据集介绍

构建方式
RAID-Database通过精心设计的实验构建,旨在收集人类对超阈值仿射图像变换(如旋转、平移、缩放)和高斯噪声的主观反应。实验采用了经典的Maximum Likelihood Difference Scaling (MLDS)方法,该方法通过比较同一参考图像和相同类型的失真图像,生成每个刺激的响应曲线。实验共包含864张失真图像,涵盖了四种失真类型,每种失真有九个增量级别。实验涉及105名观察者,进行了超过20,000次四重图像比较,确保了数据的广泛性和代表性。
特点
RAID-Database的显著特点在于其专注于自然环境中常见的仿射变换失真,而非数字媒体中的常见失真。数据集通过MLDS方法生成的响应曲线,不仅覆盖了从零(低于阈值)到显著高于阈值的广泛刺激范围,还提供了内部噪声的估计值,用于曲线缩放。此外,数据集与TID2013数据库在最大高斯噪声级别上对齐,使得两个数据集可以联合使用并进行质量比较。
使用方法
RAID-Database可用于训练和验证预测人类主观感知的图像质量模型。用户可以通过提供的Python代码示例读取原始数据和MLDS响应数据,进行进一步的分析和模型训练。数据集与TID2013等现有图像质量数据库兼容,允许用户在不同数据集之间进行比较和联合分析。此外,数据集的MLDS响应数据已标准化,便于不同曲线之间的直接比较和研究。
背景与挑战
背景概述
RAID-Database是由Paula Daud´en-Oliver等人于2024年创建的,旨在研究人类对图像仿射变换(如旋转、平移、缩放)和高斯噪声的主观感知反应。该数据集的核心研究问题在于填补现有图像质量数据库在自然条件下常见畸变方面的空白。通过使用经典的Maximum Likelihood Difference Scaling方法,研究人员收集了105名观察者对864张经过仿射变换和高斯噪声处理的图像的反应,共计超过20000次比较。该数据集不仅验证了经典的Piéron定律和绝对检测阈值,还通过Group-MAD实验展示了其相较于传统数据库(如TID2013)在描述人类行为方面的优越性。RAID-Database的推出为图像处理和视觉科学领域提供了重要的实验数据,特别是在评估人工视觉系统与人类视觉系统的一致性方面具有深远影响。
当前挑战
RAID-Database在构建过程中面临了多项挑战。首先,如何确保仿射变换和高斯噪声的畸变水平能够准确反映人类在自然环境中的视觉体验是一个关键问题。其次,使用Maximum Likelihood Difference Scaling方法进行心理物理学实验时,如何设计实验以避免观察者的疲劳并确保数据的可靠性也是一个挑战。此外,与现有数据库(如TID2013)的兼容性和可比性问题也需要解决,以确保新数据集能够与现有研究无缝对接。最后,如何通过实验验证数据集的质量,确保其能够准确反映人类对图像畸变的感知,也是该数据集面临的重要挑战。
常用场景
经典使用场景
RAID-Database 主要用于研究人类对图像仿射变换(如旋转、平移、缩放)和高斯噪声的主观感知反应。该数据集通过最大似然差异缩放法(MLDS)收集了105名观察者对864张经过仿射变换和高斯噪声处理的图像的反应,提供了丰富的数据以支持图像质量评估模型的训练与验证。
解决学术问题
RAID-Database 解决了现有图像质量数据库主要关注数字媒体中的常见失真,而忽视自然环境中常见仿射变换的问题。通过模拟自然环境中的仿射变换和高斯噪声,该数据集为研究人类视觉系统对这些变换的感知提供了重要数据支持,有助于改进现有的感知质量评估模型,并推动人工视觉系统与人类视觉行为的一致性研究。
衍生相关工作
RAID-Database 的发布激发了大量相关研究工作,特别是在图像质量评估和人类视觉模型领域。例如,研究者们利用该数据集验证了深度学习模型在处理仿射变换和高斯噪声时的表现,并提出了新的感知质量评估指标。此外,该数据集还为开发更符合人类视觉特性的图像处理算法提供了实验基础,推动了图像处理技术在实际应用中的进一步发展。
以上内容由遇见数据集搜集并总结生成



