VectorEdits

Hugging Face2025-05-22 更新2025-05-23 收录

下载链接：

https://huggingface.co/datasets/authoranonymous321/VectorEdits

下载链接

链接失效反馈

官方服务：

资源简介：

VectorEdits是一个用于指令基础向量图形编辑的数据集和基准测试。它包含了训练集、验证集和测试集，适用于文本到文本生成的任务。数据集中的每个项目都包含了标题、标签、许可证信息以及与编辑相关的各种属性，如完成原因、日志概率、模型名称、令牌数和温度等。

创建时间：

2025-05-20

原始信息汇总

VectorEdits 数据集概述

数据集基本信息

名称: VectorEdits: A Dataset and Benchmark for Instruction-Based Editing of Vector Graphics
语言: 英语 (en)
标签: svg, editing, dataset, train, eval
任务类别: 文本生成文本 (text2text-generation)
数据规模: 100K<n<1M

数据集结构

特征 (Features)

collection_slug: 字符串类型
item_1: 结构体类型，包含以下子字段：
- caption_finish_reasons: 字符串序列
- caption_logprobs: 浮点数序列 (float64)
- caption_model_name: 字符串序列
- caption_num_tokens: 整数序列 (int64)
- caption_temperature: 浮点数序列 (float64)
- caption_texts: 字符串序列
- collection_id: 整数类型 (int64)
- collection_slug: 字符串类型
- item_id: 整数类型 (int64)
- item_license: 字符串类型
- item_license_link: 字符串类型
- item_license_owner: 字符串类型
- item_slug: 字符串类型
- item_svg: 字符串类型
- item_tags: 字符串序列
- item_title: 字符串类型
item_2: 结构体类型，子字段与item_1相同
similarity: 浮点数类型 (float64)
instruction: 字符串类型

数据划分 (Splits)

train:
- 样本数量: 269,106
- 数据大小: 2,281,819,762 字节
validation:
- 样本数量: 200
- 数据大小: 1,214,438 字节
test:
- 样本数量: 2,000
- 数据大小: 12,718,293 字节

下载与存储信息

下载大小: 274,954,282 字节
数据集总大小: 2,295,752,493 字节

配置文件 (Configs)

默认配置 (default):
- 训练数据路径: data/train-*
- 验证数据路径: data/validation-*
- 测试数据路径: data/test-*

搜集汇总

数据集介绍

构建方式

在计算机视觉与自然语言处理交叉领域，VectorEdits数据集通过系统化流程构建而成。该数据集从SVG Repo平台采集矢量图形，运用CLIP模型计算图像嵌入的余弦相似度，筛选出视觉关联紧密的图形对。随后采用视觉语言模型自动生成描述图形变换的自然语言指令，最终形成包含27万组矢量图形与文本指令的配对数据，为指令驱动的矢量图形编辑任务奠定基础。

特点

该数据集具有多维度技术特征，其核心在于融合结构化矢量图形与语义化文本指令。每个数据单元包含原始与编辑后的SVG源码及完整元数据，涵盖版权信息、标签分类等属性。独特的相似度指标量化了图形变换程度，而分层数据集架构支持模型训练与评估的完整流程。这种设计既保留了矢量图形的数学精确性，又通过自然语言接口降低了操作门槛。

使用方法

研究人员可通过标准数据加载接口快速启用该数据集，使用HuggingFace生态中的datasets库直接调用即可获取全部分割版本。训练集适用于模型参数优化，验证集用于超参数调整，测试集则专门用于性能基准评估。数据字段经过标准化处理，支持直接解析SVG源码进行渲染分析，或提取文本指令进行语义理解，为矢量图形生成与编辑算法研究提供完整实验环境。

背景与挑战

背景概述

随着数字媒体技术的飞速发展，矢量图形编辑在计算机视觉和图形学领域占据重要地位。VectorEdits数据集由匿名研究团队于近期构建，专注于基于自然语言指令的矢量图形编辑任务。该数据集包含超过27万对SVG图像及其对应的文本编辑指令，旨在推动智能模型根据用户语言描述自动修改矢量图形的能力。其数据来源于SVG Repo公开资源，通过CLIP相似性匹配和视觉语言模型生成指令，为相关研究提供了大规模基准支持，显著促进了人机交互与创意设计工具的智能化进程。

当前挑战

在矢量图形编辑领域，核心挑战在于模型需精确解析文本指令并生成结构正确的SVG代码，同时保持图形的视觉一致性和语义准确性。构建过程中，数据采集面临SVG图像质量不一和指令生成可靠性的难题，需通过CLIP嵌入筛选和模型增强来确保数据对的有效性。此外，当前先进语言模型在处理复杂编辑任务时，常出现语法错误或逻辑偏差，突显了该任务在跨模态理解和代码生成方面的严峻考验。

常用场景

经典使用场景

在计算机视觉与图形学领域，VectorEdits数据集为基于自然语言指令的矢量图形编辑任务提供了标准化评估框架。该数据集通过27万对SVG图像与文本指令的配对，支持模型学习如何根据人类语言描述精确修改矢量元素，例如调整图形颜色、形状或布局，从而推动智能设计工具的发展。

实际应用

在实际应用中，VectorEdits数据集为智能设计平台提供了核心训练资源。基于该数据训练的模型可辅助设计师快速完成图标优化、界面元素调整等任务，通过自然语言交互降低专业工具使用门槛，广泛应用于数字媒体创作、教育课件制作等需要高效图形处理的场景。

衍生相关工作

该数据集催生了多项矢量图形生成领域的创新研究。基于其构建的基准测试推动了如指令增强型Transformer架构、多模态语义解析器等经典工作的发展，这些成果进一步拓展至动态图形生成、跨域风格迁移等方向，形成了完整的矢量图形智能处理技术生态。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集