five

IST Generalized Perspective Projection Dataset

收藏
github2020-07-16 更新2024-05-31 收录
下载链接:
https://github.com/jascenso/IST-GPP-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
IST广义透视投影数据集包含八张来自Salient360!数据集的全景图像,采用等距圆柱格式。图像分辨率分为8K和4K两种,涵盖室内外场景、近远物体及人物存在与否。每张图像针对前视、右45°和左45°三个视角方向生成十种视口,每个视口对应一对(d, FoV)参数,其中d取值为0,0.25,0.5,0.75,1,FoV取值为90°和110°。视口分辨率为856×856像素。

The IST Generalized Perspective Projection Dataset includes 8 panoramic images sourced from the Salient360! Dataset, which are stored in equirectangular projection format. The images are available in two resolutions: 8K and 4K, covering indoor and outdoor scenes, near and far objects, as well as scenarios with or without human subjects. For each input image, ten viewports are generated across three viewing directions: forward, 45° right, and 45° left. Each viewport corresponds to a pair of (d, FoV) parameters, where d takes discrete values of 0, 0.25, 0.5, 0.75, and 1, while FoV takes values of 90° and 110°. The resolution of each generated viewport is 856×856 pixels.
创建时间:
2019-04-10
原始信息汇总

IST Generalized Perspective Projection Dataset

数据集描述

  • 图像来源:数据集包含8张来自Salient360!数据集的等矩形格式全景图像。
  • 图像分辨率:图像2、6、8的分辨率为7500×3750像素(8K),其余图像分辨率为3840×1920像素(4K)。
  • 图像内容:包括室内外场景、近远物体及人物的存在与否。

渲染参数

  • 视口方向:前视、右45°、左45°。
  • 视口数量:每个方向产生10个视口。
  • 参数组合:每个视口对应一对参数(d, FoV),其中d取值为{0,0.25,0.5,0.75,1},FoV取值为{90°,110°}。
  • 视口分辨率:856×856像素。

评估方法

  • 评估方法:采用Stimulus Comparison Adjectival Categorical Judgment (SCACJ)。
  • 评估目的:便于受试者在不同投影的视口对中选择最舒适的视口。
  • 参考刺激:使用直角投影(d=0)作为参考刺激。

参考文献

  1. Gutiérrez, J., David, E., Coutrot, A., Perreira Da Silva, M., & Le Callet, P. (2018). Introducing UN Salient360! Benchmark: A platform for evaluating visual attention models for 360 contents. International Conference on Quality of Multimedia Experience (QoMEX), Sardinia, Italy.
  2. Jabar, F., Ascenso, J., & Queluz, M.P. Objective Assessment of Perceived Geometric Distortions in Viewport Rendering of 360° Images. (待出版)
搜集汇总
数据集介绍
main_image_url
构建方式
IST广义透视投影数据集的构建基于Salient360!数据集中的八张全景图像,这些图像以等距柱状投影格式呈现,分辨率分别为7500×3750像素(8K)和3840×1920像素(4K)。图像内容涵盖室内外场景、远近物体及人物存在与否等多种类型。针对每张图像,生成了三种不同视角的视口:正面、右45°和左45°。每个视角下,进一步生成了十个视口,分别对应不同的投影中心参数d和视场角FoV组合,其中d∈{0,0.25,0.5,0.75,1},FoV∈{90°,110°}。视口分辨率为856×856像素。主观评估采用刺激比较形容词分类判断法(SCACJ),以直线投影(d=0)作为参考刺激。
使用方法
使用IST广义透视投影数据集时,研究人员可以通过加载不同d和FoV组合的视口图像,进行视觉感知实验或算法验证。首先,用户可以根据研究需求选择特定场景或视角的视口数据,随后利用SCACJ方法进行主观评估,或开发客观评估算法以量化几何失真。数据集中的参考视口(d=0)可作为基准,用于对比不同投影参数下的视觉质量。此外,数据集的高分辨率特性使其适用于深度学习模型的训练和测试,尤其是在360°图像渲染和视觉注意力建模领域。
背景与挑战
背景概述
IST Generalized Perspective Projection Dataset 是由葡萄牙里斯本高等理工学院(IST)的研究团队创建的一个专注于广义透视投影评估的数据集。该数据集于2018年发布,旨在研究不同投影参数对360度图像渲染质量的主观感知影响。数据集基于Salient360!数据集中的八幅全向图像,涵盖了室内外场景、远近物体以及人物等多种内容类型。通过生成不同投影中心(d)和视场角(FoV)组合的视口图像,研究人员探索了投影参数对视觉体验的影响。该数据集为360度图像渲染和视觉感知研究提供了重要的实验基础,推动了相关领域的发展。
当前挑战
IST Generalized Perspective Projection Dataset 的核心挑战在于如何准确评估广义透视投影对360度图像视觉感知的影响。首先,投影参数的选择(如投影中心d和视场角FoV)需要平衡视觉失真与用户舒适度,过高的d值会导致鱼眼效应,影响观看体验。其次,主观评估方法的有效性至关重要,数据集采用刺激比较形容词分类判断(SCACJ)方法,要求受试者在不同投影视口之间进行选择,这增加了实验设计的复杂性。此外,数据集的构建还面临图像分辨率差异(4K与8K)和内容多样性带来的挑战,这些因素可能影响评估结果的普适性和一致性。
常用场景
经典使用场景
IST Generalized Perspective Projection Dataset 主要用于研究广义透视投影在360度图像渲染中的应用效果。通过使用不同投影中心d和视场角FoV的组合,该数据集能够帮助研究者评估不同投影参数对视觉体验的影响。经典的使用场景包括在虚拟现实(VR)和增强现实(AR)环境中,优化图像渲染以提供更自然的视觉体验。
解决学术问题
该数据集解决了在360度图像渲染中如何减少几何失真和视觉不适感的学术问题。通过主观评估方法,研究者能够量化不同投影参数对视觉质量的影响,从而为图像处理和计算机视觉领域提供了重要的参考数据。这一研究不仅推动了投影技术的进步,还为未来的视觉内容优化提供了理论基础。
实际应用
在实际应用中,IST Generalized Perspective Projection Dataset 被广泛用于虚拟现实和增强现实设备的图像渲染优化。通过分析不同投影参数对用户视觉体验的影响,开发者能够设计出更符合人类视觉习惯的渲染方案,从而提升用户的沉浸感和舒适度。此外,该数据集还可用于电影制作和游戏开发中的视觉特效设计。
数据集最近研究
最新研究方向
在虚拟现实和增强现实领域,IST Generalized Perspective Projection Dataset为研究广义透视投影的主观评估提供了重要数据支持。该数据集通过使用Salient360!数据集中的八张全向图像,结合不同的投影中心参数d和视场角FoV,生成了多种视角的视口图像。这些图像涵盖了室内外场景、远近物体以及人物存在与否等多种内容类型,为研究不同投影参数对视觉体验的影响提供了丰富的实验材料。当前研究热点集中在如何通过优化投影参数来减少视觉失真,提升用户在虚拟环境中的沉浸感和舒适度。该数据集的应用不仅推动了360度图像渲染技术的发展,还为视觉注意力模型和用户体验评估提供了新的研究方向。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作