SVGEditBench V2
收藏arXiv2025-02-26 更新2025-03-04 收录
下载链接:
https://github.com/mti-lab/SVGEditBenchv2
下载链接
链接失效反馈官方服务:
资源简介:
SVGEditBench V2是一个用于指令基础SVG编辑的基准数据集,由东京大学创建。该数据集包含原始SVG图像、编辑后的地面真实SVG图像和编辑提示组成的 triplet。通过从多个公开的SVG表情符号数据集中提取图像对,并使用GPT-4o生成编辑提示构建而成。数据集涵盖了从简单的颜色更改到复杂的元素转换等多种编辑任务,适用于评估SVG编辑方法的效果。
SVGEditBench V2 is a benchmark dataset for instruction-based SVG editing, developed by The University of Tokyo. This dataset consists of triplets composed of original SVG images, edited ground-truth SVG images and corresponding editing prompts. It is constructed by extracting image pairs from multiple publicly available SVG emoji datasets and generating editing prompts using GPT-4o. The dataset covers a wide range of editing tasks, from simple color modifications to complex element transformations, and is suitable for evaluating the performance of SVG editing methods.
提供机构:
日本东京大学
创建时间:
2025-02-26
搜集汇总
数据集介绍

构建方式
SVGEditBench V2 是一个基于指令的 SVG 编辑基准数据集,旨在评估和促进 SVG 编辑技术的发展。该数据集由 1,683 个三元组组成,每个三元组包含一个原始 SVG 图像、一个经过编辑的 SVG 图像和一个编辑文本提示。数据集的构建过程包括从多个 SVG 表情符号数据集中提取图像对,然后使用 GPT-4o 生成编辑提示。这种方法确保了数据集中包含了各种编辑任务,从简单的颜色变化到复杂的对象转换和风格转换。
特点
SVGEditBench V2 的特点在于其任务的多样性和复杂性。数据集中的任务不仅包括简单的颜色变化,还包括对象转换、风格转换等更复杂的任务。此外,数据集中的编辑提示以对象名称而非颜色描述编辑内容,这要求编辑模型具备对图像内容的语义理解能力。在评估方面,SVGEditBench V2 使用了像素值均方误差、DINOv2 特征余弦相似度、CLIPScore 和 Chamfer 距离等四个指标,从视觉、语义和几何等多个方面全面评估 SVG 编辑效果。
使用方法
SVGEditBench V2 可用于评估和训练 SVG 编辑模型。使用时,首先使用编辑提示对原始 SVG 图像进行编辑,然后将编辑后的图像与数据集中的真实图像进行比较,利用像素值均方误差、DINOv2 特征余弦相似度、CLIPScore 和 Chamfer 距离等指标评估编辑效果。此外,SVGEditBench V2 还可用于分析现有模型在 SVG 编辑方面的优势和不足,为未来 SVG 编辑技术的发展提供参考。
背景与挑战
背景概述
SVGEditBench V2 是一个用于指令式 SVG 编辑的基准数据集,由东京大学的 Kunato Nishina 和 Yusuke Matsui 于 2025 年创建。该数据集旨在解决矢量图形编辑领域缺乏统一基准和数据的现状,为评估和改进 SVG 编辑方法提供平台。SVGEditBench V2 包含 1,683 个三元组,每个三元组包括原始图像、编辑后的图像和编辑提示。该数据集的创建过程涉及从现有的 SVG 表情符号数据集中提取图像对,并使用 GPT-4o 生成编辑提示。SVGEditBench V2 的提出对相关领域产生了重要影响,促进了文本到矢量图形编辑的研究,并为评估和改进 SVG 编辑方法提供了宝贵资源。
当前挑战
SVGEditBench V2 面临的挑战主要包括:1) SVG 编辑任务的挑战,即如何生成符合提示的、高质量的 SVG 图像;2) 构建过程中的挑战,包括如何选择合适的原始图像和编辑后的图像,如何生成准确的编辑提示,以及如何评估编辑结果等。此外,SVGEditBench V2 还面临着一些技术挑战,例如如何有效地处理 <path> 元素,如何提高模型生成 SVG 代码的准确性和鲁棒性,以及如何更好地利用模型的语言理解和视觉能力进行 SVG 编辑等。
常用场景
经典使用场景
SVGEditBench V2 是一个用于评估基于指令的 SVG 编辑方法的基准数据集,包含了 1,683 个三元组,每个三元组包括原始 SVG 图像、编辑后的真实图像和编辑文本提示。这个数据集主要用于训练和评估 LLMs 和 LMMs 在 SVG 编辑方面的能力。例如,研究人员可以使用这个数据集来训练一个模型,使其能够根据文本指令编辑 SVG 图像,例如改变颜色、添加或删除元素等。此外,这个数据集也可以用于评估现有 LLMs 和 LMMs 在 SVG 编辑方面的性能,例如比较不同模型在相同任务上的表现。
解决学术问题
SVGEditBench V2 解决了 SVG 编辑领域中缺乏统一基准和数据集的问题。在此之前,虽然有一些研究尝试生成或编辑矢量图形,但由于缺乏数据集和基准,这方面的研究相对较少。SVGEditBench V2 提供了一个统一的数据集,使得研究人员可以更方便地训练和评估 SVG 编辑模型。此外,SVGEditBench V2 还提供了更广泛的复杂编辑任务,例如基于对象名称的编辑任务,这要求编辑模型具有语义理解的能力。
衍生相关工作
SVGEditBench V2 衍生了相关经典工作,例如 SVGEditBench。SVGEditBench 是一个用于评估 LLMs 在 SVG 编辑方面的能力的基准数据集,但与 SVGEditBench V2 相比,SVGEditBench 提供的任务范围更有限,只包括六个预定义的简单任务。SVGEditBench V2 提供了更广泛的复杂编辑任务,例如基于对象名称的编辑任务,这要求编辑模型具有语义理解的能力。此外,SVGEditBench V2 还提供了更全面的评估指标,包括像素值、语义和几何方面的指标,从而更全面地评估 SVG 编辑模型的性能。
以上内容由遇见数据集搜集并总结生成



