SpatialEdit-Bench

Hugging Face2026-04-07 更新2026-04-08 收录

下载链接：

https://huggingface.co/datasets/EasonXiao-888/SpatialEdit-Bench

下载链接

链接失效反馈

官方服务：

资源简介：

SpatialEdit-Bench 是一个用于细粒度图像空间编辑的基准数据集，旨在评估编辑模型是否能够生成视觉上合理的结果，同时准确遵循空间变换指令。该数据集涵盖了对象中心和相机中心的编辑任务，重点关注精确的空间控制而非仅外观变化。评估范围包括对象移动、对象旋转和相机视角变化等编辑任务。该数据集作为 SpatialEdit 项目的一部分发布，用于评估感知合理性和几何保真度。

创建时间：

2026-04-04

原始信息汇总

SpatialEdit-Bench 数据集概述

数据集简介

SpatialEdit-Bench 是一个用于细粒度图像空间编辑的基准数据集。该数据集旨在评估编辑模型能否在准确遵循空间变换指令的同时，产生视觉上合理的结果。

核心特点

专注于细粒度的空间图像编辑。
涵盖对象级和相机级两种变换任务。
强调精确的空间控制，而非仅外观变化。
评估感知合理性和几何保真度。
作为 SpatialEdit 项目的一部分发布。

评估范围

数据集用于评估以下类型的编辑：

对象移动
对象旋转
相机视角变化

项目相关资源

论文：https://arxiv.org/pdf/2604.04911
GitHub 仓库：https://github.com/EasonXiao-888/SpatialEdit
训练数据：https://huggingface.co/datasets/EasonXiao-888/SpatialEdit-500K
模型：https://huggingface.co/EasonXiao-888/SpatialEdit-16B

许可证

Apache License 2.0

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，精细化的空间编辑能力是衡量图像生成模型先进性的关键指标。SpatialEdit-Bench的构建过程聚焦于创建一套系统化的评估基准，其核心在于精心设计涵盖物体中心与相机中心两大范畴的编辑任务。数据集通过整合多样化的空间变换指令，如物体移动、旋转及视角转换，并配以对应的源图像与目标描述，确保了评估任务既具挑战性又贴近实际应用场景。这一构建方式旨在为模型提供一个能够严格检验其几何保真度与视觉合理性的标准化测试平台。

特点

该数据集的显著特征在于其针对图像空间编辑的细粒度评估导向。它不仅区分了物体层级与相机层级的空间变换，更将评估重点从单纯的外观改变深化为对精确几何控制的考量。数据集任务设计强调视觉结果的真实感与对空间指令的遵循准确性，从而能够全面衡量模型在理解并执行复杂空间关系方面的性能。这种专注于空间维度而非仅限外观的特性，使其在当前的图像编辑基准中独树一帜。

使用方法

使用SpatialEdit-Bench进行评估时，研究者通常将待测的图像编辑模型在数据集提供的指令-图像对上进行推理。通过对比模型输出图像与预期目标在几何变换上的吻合度以及整体视觉质量，可以量化模型的编辑能力。具体评估可结合项目提供的代码与指标，系统分析模型在物体移动、旋转及视角变化等任务上的表现，从而为模型优化与比较提供客观、可复现的实验依据。

背景与挑战

背景概述

在计算机视觉与图像生成领域，精细化的空间编辑任务长期面临指令理解与几何保真度之间的平衡难题。SpatialEdit-Bench作为一项专注于细粒度图像空间编辑的基准数据集，由EasonXiao-888团队于2024年发布，其核心研究问题在于评估编辑模型在遵循空间变换指令的同时，能否生成视觉逼真且几何精确的结果。该数据集涵盖了对象中心与相机中心两类编辑任务，旨在推动图像编辑技术从单纯的外观调整迈向对空间关系的精确控制，为生成式模型的可控性研究提供了重要的评估工具。

当前挑战

该数据集致力于解决图像编辑中空间变换指令的精准执行与视觉合理性协同的挑战，具体包括模型在对象移动、旋转及相机视角变换等任务中保持几何一致性的困难。在构建过程中，挑战主要源于如何设计涵盖多样场景与复杂空间关系的样本，以确保基准的全面性与泛化能力，同时需平衡数据标注的精确度与规模，以支撑对模型性能的可靠评估。

常用场景

经典使用场景

在计算机视觉与图像生成领域，SpatialEdit-Bench作为细粒度空间编辑的基准数据集，其经典使用场景集中于评估图像编辑模型在遵循空间变换指令时的性能表现。该数据集通过涵盖物体移动、旋转及相机视角变化等任务，为研究者提供了标准化的测试平台，以检验模型在保持视觉合理性的同时，能否精准实现几何层面的操控，从而推动可控图像编辑技术的发展。

衍生相关工作

围绕SpatialEdit-Bench，已衍生出多项经典研究工作，包括其配套项目SpatialEdit所提出的训练框架与模型架构。这些工作基于该基准的评估指标，进一步开发了大规模训练数据集SpatialEdit-500K及预训练模型SpatialEdit-16B，推动了指令驱动图像编辑技术的演进，并为后续研究如多模态空间推理、零样本编辑等方向提供了重要基础。

数据集最近研究