SAVOIAS
收藏github2024-03-01 更新2024-05-31 收录
下载链接:
https://github.com/esaraee/Savoias-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
SAVOIAS是一个视觉复杂性数据集,包含超过1,400张来自七个不同类别的图像,用于计算机视觉应用。这些类别包括场景、广告、可视化和信息图表、物体、室内设计、艺术和至上主义。数据集通过众包方式获取超过37,000次图像对比较,使用强制选择方法和超过1,600名贡献者,通过Figure-Eight众平台完成。
SAVOIAS is a visual complexity dataset comprising over 1,400 images from seven distinct categories, designed for computer vision applications. The categories include scenes, advertisements, visualizations and infographics, objects, interior design, art, and suprematism. The dataset was compiled through a crowdsourcing effort that garnered over 37,000 image pair comparisons, utilizing a forced-choice methodology and involving more than 1,600 contributors, facilitated via the Figure-Eight platform.
创建时间:
2018-09-26
原始信息汇总
SAVOIAS Dataset 概述
数据集描述
- 名称: SAVOIAS
- 类型: 视觉复杂度数据集
- 图像数量: 超过1,400张
- 类别: 共7类,包括场景、广告、可视化与信息图、物体、室内设计、艺术和至上主义。
- 图像特征: 包含多种低级和高级特征,如物体、背景、纹理、图案、文本和图形。
数据集构建
- 数据来源: 来自多个专业数据集和特定领域。
- 标注方法: 通过众包方式,使用强制选择方法进行超过37,000次图像对比较,涉及超过1,600名贡献者。
- 评分转换: 使用Bradley-Terry方法和矩阵完成将相对分数转换为绝对视觉复杂度分数。
数据集使用
- 存储位置: 图像存储于Images文件夹,按类别分类。
- 原始图像名称: 可通过Name_Mapping文件夹获取。
- 视觉复杂度评分: 存储于Ground truth文件夹。
数据集分析
- 分析结果: 应用五种最先进算法分析,发现与人群标注的标签在至上主义类别中相关性高(Pearson相关系数r=0.84),而在物体和广告类别中相关性较低(r=0.3和0.56)。
- 研究意义: 表明现有方法在某些类别中不足,SAVOIAS数据集有助于特定类别方法的开发,可能提升视觉复杂度分析在计算机视觉等领域的应用。
数据集引用
- 引用文献:
- Saraee, Elham, Mona Jalal, and Margrit Betke. "SAVOIAS: A Diverse, Multi-Category Visual Complexity Dataset." arXiv preprint arXiv:1810.01771 (2018).
- Saraee, Elham, Mona Jalal, and Margrit Betke. "Visual complexity analysis using deep intermediate-layer features." Computer Vision and Image Understanding (2020): 102949.
数据集许可
- 许可类型: Apache License 2.0
搜集汇总
数据集介绍

构建方式
SAVOIAS数据集的构建过程体现了多源数据整合与大规模众包标注的精密结合。该数据集涵盖了七个图像类别,包括场景、广告、可视化与信息图表、物体、室内设计、艺术以及至上主义。通过Figure-Eight众包平台,超过1,600名贡献者完成了37,000多对图像的强制选择比较,获取了图像的相对复杂性评分。随后,利用Bradley-Terry方法和矩阵补全技术,将这些相对评分转化为绝对视觉复杂性评分,确保了数据的科学性与可靠性。
特点
SAVOIAS数据集以其多样性和广泛性著称,包含超过1,400张图像,涵盖了从自然场景到抽象艺术的多种视觉内容。每类图像均展现了丰富的低层次与高层次特征,如物体、背景、纹理、图案、文本和图形等。该数据集的独特之处在于其类别特定的视觉复杂性评分,为计算机视觉领域的研究提供了宝贵的基准数据。此外,数据集还揭示了现有视觉复杂性分析算法在不同类别中的表现差异,为未来方法开发提供了重要启示。
使用方法
SAVOIAS数据集的使用方法简洁明了。用户可通过Git克隆仓库获取数据集,其中包含七个类别的1,420张图像,分别存储于Images文件夹中。Name_Mapping文件夹提供了图像原始名称的映射信息,便于研究者追溯数据来源。Ground truth文件夹中则包含了每张图像的视觉复杂性评分。研究者可利用这些数据进行视觉复杂性分析、算法验证或类别特定的方法开发。数据集的开源许可进一步促进了其在学术研究中的广泛应用。
背景与挑战
背景概述
SAVOIAS数据集由Elham Saraee、Mona Jalal和Margrit Betke等研究人员于2018年推出,旨在为视觉复杂性分析提供一个多样化的多类别图像数据集。该数据集包含来自七个类别的1400多张图像,涵盖场景、广告、可视化与信息图表、物体、室内设计、艺术和至上主义等类别。通过众包平台Figure-Eight,超过1600名参与者完成了37,000多对图像的强制选择比较,并使用Bradley-Terry方法和矩阵补全技术将相对评分转换为绝对视觉复杂性评分。SAVOIAS数据集的推出为计算机视觉领域的研究提供了新的视角,特别是在视觉复杂性分析的类别特异性方法开发方面,具有重要的学术价值和应用潜力。
当前挑战
SAVOIAS数据集在解决视觉复杂性分析问题时面临多重挑战。首先,现有算法在处理不同类别图像时表现不一,尤其是在物体和广告类别中,与人类标注的相关性较低,表明现有方法在视觉复杂性分析上的局限性。其次,数据集的构建过程中,如何确保众包标注的一致性和准确性是一个关键问题。尽管采用了强制选择方法和统计模型进行评分转换,但不同参与者对视觉复杂性的主观感知差异仍可能影响数据的可靠性。此外,数据集的多样性和复杂性也为算法的泛化能力提出了更高要求,如何在多类别场景下提升视觉复杂性分析的精度和鲁棒性,是未来研究的重要方向。
常用场景
经典使用场景
SAVOIAS数据集在计算机视觉领域中被广泛应用于视觉复杂度的分析与研究。其包含的七个图像类别,如场景、广告、可视化与信息图表等,为研究者提供了多样化的视觉素材。通过使用该数据集,研究者能够深入探讨不同类别图像的视觉复杂度特征,并开发针对特定类别的视觉复杂度分析方法。
解决学术问题
SAVOIAS数据集解决了现有视觉复杂度分析方法在多样化图像类别上表现不足的问题。通过提供超过1,400张图像及其对应的视觉复杂度评分,该数据集为研究者提供了丰富的实验数据,推动了视觉复杂度分析方法的改进与创新。特别是在抽象图案类别中,现有方法与人类标注的相关性较高,为相关研究提供了有力支持。
衍生相关工作
基于SAVOIAS数据集,研究者开发了多种深度学习模型,用于预测图像的视觉复杂度。这些模型通过提取图像的中间层特征,显著提升了视觉复杂度预测的准确性。相关研究成果已在计算机视觉领域的顶级期刊上发表,为后续研究提供了重要的参考和借鉴。
以上内容由遇见数据集搜集并总结生成



