SIFR

github2024-05-16 更新2024-05-31 收录

下载链接：

https://github.com/EricDengbowen/QAGNet

下载链接

链接失效反馈

官方服务：

资源简介：

我们提出了第一个使用真实人类注视而非鼠标移动（ASSR和IRSR）的显著性排名数据集SIFR。

We present the first saliency ranking dataset, SIFR, which utilizes real human gaze data instead of mouse movements (ASSR and IRSR).

创建时间：

2023-11-13

原始信息汇总

SIFR Dataset

Description: SIFR is the first saliency ranking dataset using genuine human fixations, distinguishing it from datasets that use mouse movements (ASSR and IRSR).
Visual Analysis: Includes images illustrating the differences between human gaze ground truth and mouse-trajectory ground truth, as well as dataset analysis.
Download Link: SIFR Dataset

QAGNet

Model Description: QAGNet is a novel model proposed as a baseline for the SIFR dataset, leveraging salient instance query features from a query-based transformer detector (Mask2Former) within a tri-tiered nested graph.
Installation: Based on Mask2Former, with installation instructions provided.
Training: Requires downloading ASSR, IRSR, and SIFR datasets, configuring dataset paths, and using pretrained weights of Mask2Former.
Testing: Involves downloading pretrained models, configuring weights path, and running evaluation settings.

Benchmark

Predicted Saliency Ranking Maps: Available for download, providing quantitative and qualitative comparisons as detailed in the paper.

Citing

Citation Information: For academic use, the dataset and model can be cited using the provided BibTeX entry.

搜集汇总

数据集介绍

构建方式

SIFR数据集的构建方式独具匠心，其核心在于利用真实的人类注视点而非传统的鼠标轨迹数据。通过采集和分析人类在视觉任务中的注视点，SIFR数据集得以捕捉到更为自然和真实的视觉注意力分布。这一方法不仅提升了数据集的生物学合理性，也为后续的显著性排序研究提供了更为可靠的基础。

使用方法

使用SIFR数据集时，研究者首先需从指定链接下载数据集文件，并配置相应的路径。随后，可以利用QAGNet模型进行训练和测试，该模型基于Mask2Former框架，通过查询图网络结构处理显著实例特征。训练过程中，需配置预训练权重和相应的YAML脚本，以确保模型能够有效学习数据集中的注视点模式。测试阶段，则需加载预训练模型并配置评估设置，以生成和分析显著性排序图。

背景与挑战

背景概述

SIFR数据集由CVPR 2024会议论文《Advancing Saliency Ranking with Human Fixations: Dataset, Models and Benchmarks》提出，旨在通过真实的人类注视点而非鼠标轨迹来推进显著性排序研究。该数据集由Bowen Deng等研究人员创建，主要研究问题是如何利用人类注视点数据提升显著性排序的准确性和鲁棒性。SIFR数据集的推出填补了现有数据集中使用鼠标轨迹代替人类注视点的空白，为计算机视觉领域的显著性检测和排序提供了新的基准。

当前挑战

SIFR数据集在构建过程中面临的主要挑战包括：1) 获取真实人类注视点的数据采集难度较大，需要克服数据采集设备和方法的限制；2) 数据集的标注和处理过程复杂，确保注视点数据的准确性和一致性是一个技术难题。此外，利用SIFR数据集进行模型训练和评估时，如何有效整合显著性实例查询特征与查询基变换检测器（如Mask2Former）也是一个重要的挑战。

常用场景

经典使用场景

SIFR数据集在显著性排序领域中具有经典的使用场景，主要用于评估和改进基于人类注视点的显著性排序模型。通过提供真实的人类注视点数据，而非传统的鼠标轨迹数据，SIFR数据集使得研究人员能够更准确地捕捉和分析人类视觉注意力的分布。这种数据集的应用不仅限于学术研究，还在实际应用中为图像和视频的自动标注、广告推荐等领域提供了强有力的支持。

解决学术问题

SIFR数据集解决了显著性排序领域中长期存在的学术问题，即如何更精确地模拟和预测人类的视觉注意力。传统的基于鼠标轨迹的数据集在捕捉人类视觉行为方面存在局限性，而SIFR通过引入真实的人类注视点数据，显著提升了显著性排序模型的准确性和鲁棒性。这一突破不仅推动了显著性排序技术的发展，还为相关领域的研究提供了新的视角和方法。

实际应用

在实际应用中，SIFR数据集被广泛应用于图像和视频的自动标注、广告推荐、用户界面设计优化等领域。通过利用SIFR数据集训练的模型，企业能够更精准地预测用户的视觉注意力，从而优化广告投放策略和界面设计，提升用户体验。此外，SIFR数据集还在自动驾驶、安防监控等需要实时视觉注意分析的场景中展现出巨大的应用潜力。

数据集最近研究