five

MrOvkill/svgen_500k_rasterized_jsonified_uuided

收藏
Hugging Face2024-07-05 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/MrOvkill/svgen_500k_rasterized_jsonified_uuided
下载链接
链接失效反馈
官方服务:
资源简介:
SVGEN RJU数据集是一个包含SVG图像及其相关信息的集合,主要用于文本生成任务,特别是与空间推理和顶点操作相关的模型开发。数据集中的图像以PNG格式存储为字节数据,可以通过创建`io.BytesIO`实例并运行`Image.open`来提取。数据集包含描述、图像数据、SVG代码、UUID、JSON数据和来源信息。

The SVGEN RJU dataset includes SVG images that have been rasterized and converted to PNG format. Each image contains a description, image bytes, SVG code, UUID, JSON data, and source information. The dataset is primarily used for training spatial reasoning and vertex manipulation models.
提供机构:
MrOvkill
原始信息汇总

数据集概述

基本信息

  • 语言: 英语 (en)
  • 许可证: MIT
  • 数据集大小: 100K<n<1M
  • 任务类别: 文本生成 (text-generation)
  • 数据集名称: SVGEN RJU

数据集结构

  • 特征:
    • description: 字符串 (string)
    • image: 结构体
      • bytes: 二进制 (binary)
      • path: 空值 (null)
    • svg: 字符串 (string)
    • uuid: 字符串 (string)
    • json: 字符串 (string)
    • source: 字符串 (string)

数据分割

  • 训练集 (train):
    • 样本数量: 216275
    • 字节数: 3151387335

下载信息

  • 下载大小: 1843399077
  • 数据集大小: 3151387335

配置

  • 默认配置 (default):
    • 数据文件路径: data/train-*

标签

  • art
  • code
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作