RetarSet

github2025-05-12 更新2025-05-13 收录

下载链接：

https://github.com/wwwwwwwsy/Image-Retargeting-A-Dataset-and-Metrics

下载链接

链接失效反馈

官方服务：

资源简介：

我们构建了一个新颖的数据集(RetarSet)，不仅涵盖了广泛的输入/输出比例、对象数量和布局，还包括了重定向后对象分布的注释。RetarSet包含4,000张图像，均匀分布在四个宽高比中：1:1、4:3、9:16和16:9（每个比例1,000张图像）。

We constructed a novel dataset (RetarSet) that not only covers a wide range of input/output ratios, object counts and layouts, but also includes annotations for object distributions after redirection. RetarSet consists of 4,000 images evenly distributed across four aspect ratios: 1:1, 4:3, 9:16 and 16:9, with 1,000 images per ratio.

创建时间：

2025-05-11

原始信息汇总

RetarSet数据集概述

数据集简介

数据集名称：RetarSet
主要用途：图像重定向（Image Retargeting）
特点：涵盖广泛的输入/输出比例、对象数量和布局，并包含重定向后对象分布的注释

数据集构成

总图像数量：4,000张
图像比例分布：
- 1:1比例：1,000张
- 4:3比例：1,000张
- 9:16比例：1,000张
- 16:9比例：1,000张

标注信息

标注内容：重定向后前景实例的新空间布局
标注步骤：
1. 边界框标注：提取前景实例并放置最小边界正方形
2. 平移和修剪：通过Translate模块保持显著实例掩码的完整性
3. 最终调整和扩展：对裁剪或部分遮挡的显著对象进行纠正

实例数量分布

实例数量	1	2	3	4	5	6	7	8
图像数量	114	262	180	130	301	8	3	2

宽高比分布

宽高比	4:3	2:1	5:4	5:3	1:1	4:5	3:5
图像数量	754	28	32	44	17	47	78

数据获取

填写申请表
发送至cious449@gmail.com

引用要求

bibtex @misc{dataset2025, author = {SEU-WSY}, title = {Image Retargeting: A Dataset and Metrics}, year = {2025}, howpublished = {url{https://github.com/SEU-WSY/Image-Retargeting-A-Dataset}}, note = {Accessed: YYYY-MM-DD} }

搜集汇总

数据集介绍

构建方式

在图像重定向研究领域，RetarSet数据集的构建采用了系统化的标注流程。研究团队首先通过前景实例提取技术识别图像中的显著对象，随后采用最小边界正方形定位每个实例中心。通过精心设计的平移模块保持实例掩模的完整性，并在变换过程中实施校正措施以确保对象可见性。该数据集包含4,000张图像，均匀分布在1:1、4:3、9:16和16:9四种宽高比中，每类各1,000张，构建过程充分考虑了不同比例下的视觉元素分布。

特点

RetarSet数据集在实例数量和宽高比分布上展现出显著优势。数据集包含114至301个不同实例数量的样本，其中1-5个实例的样本占比达987个，为复杂场景分析提供了丰富素材。宽高比覆盖4:3至3:5等七种常见比例，其中4:3占比最高达754个样本，确保了数据分布的均衡性。特别值得注意的是，该数据集创新性地标注了重定向后对象的新空间布局，为研究图像变形过程中的内容保持提供了宝贵基准。

使用方法

研究者可通过规范流程获取RetarSet数据集的使用权限。用户需填写指定申请表格并提交至官方邮箱，经审核通过后即可获取完整数据。该数据集特别适用于评估图像重定向算法的性能表现，其详尽的实例分布标注支持定量分析变形过程中的内容保持度。在使用过程中，建议结合原始论文提供的评价指标，重点关注不同宽高比转换下前景对象的空间关系变化特征。

背景与挑战

背景概述

RetarSet数据集由东南大学WSY团队于2025年构建，专注于图像重定向领域的研究。该数据集包含4,000张图像，均匀分布在1:1、4:3、9:16和16:9四种宽高比中，每类1,000张图像。数据集不仅涵盖了多样的输入输出比例、物体数量和布局，还提供了重定向后物体分布的标注信息。RetarSet通过精确的边界框标注、平移修剪模块和最终调整扩展步骤，为图像重定向算法的评估提供了标准化基准，推动了计算机视觉领域中内容感知的图像缩放技术的发展。

当前挑战

RetarSet数据集面临的挑战主要体现在两个方面：在领域问题层面，图像重定向需要解决如何在保持重要视觉内容的同时调整图像尺寸的核心难题，这对算法的物体识别和空间关系理解能力提出了极高要求；在构建过程层面，数据集的标注工作涉及复杂的实例分割和空间变换，特别是在处理多物体重叠或部分遮挡场景时，保持标注的准确性和一致性成为主要技术难点。此外，数据集中不同宽高比和实例数量的不平衡分布也给模型的泛化性能带来挑战。

常用场景

经典使用场景

RetarSet数据集在图像重定向领域具有广泛的应用价值，其经典使用场景包括图像尺寸调整和内容感知缩放。通过提供多种宽高比和对象数量的图像，该数据集能够有效支持研究人员开发和测试图像重定向算法。特别是在处理复杂场景时，RetarSet能够帮助算法保持前景对象的完整性和布局合理性，从而提升重定向效果。

解决学术问题

RetarSet数据集解决了图像重定向领域中的多个关键学术问题，包括如何在不同的宽高比下保持前景对象的完整性，以及如何在复杂布局中实现内容感知缩放。其丰富的标注数据为研究人员提供了量化评估的基础，推动了图像重定向算法的性能提升和标准化评估方法的建立。

衍生相关工作

RetarSet数据集衍生了一系列经典研究工作，包括基于深度学习的图像重定向算法、内容感知缩放技术的优化以及多目标布局保持方法。这些工作不仅在学术界引起了广泛关注，还为工业界的实际应用提供了重要的技术支撑。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集