five

Sketch2Code-hf

收藏
Hugging Face2024-10-21 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/SALT-NLP/Sketch2Code-hf
下载链接
链接失效反馈
官方服务:
资源简介:
Sketch2Code数据集包含731个人类绘制的草图,与来自Design2Code数据集的484个真实网页配对。该数据集旨在为视觉语言模型(VLMs)在将基本草图转换为网页设计原型方面提供基准测试。数据集的特征包括ID、草图图像、源HTML和源截图图像。数据集分为一个名为'train'的分割,包含731个样本。README还提到,网页中的所有图像都被替换为一个蓝色的占位图像(rick.jpg)。

The Sketch2Code dataset comprises 731 human-drawn sketches paired with 484 real web pages sourced from the Design2Code dataset. This dataset aims to provide a benchmark for visual language models (VLMs) when converting basic hand-drawn sketches into web design prototypes. The dataset features include ID, sketch images, source HTML, and source screenshot images. It is split into a 'train' partition containing 731 samples. The README also mentions that all images within the web pages have been replaced with a blue placeholder image (rick.jpg).
提供机构:
Social And Language Technology Lab
创建时间:
2024-10-21
原始信息汇总

Sketch2Code 数据集概述

数据集信息

  • 特征:

    • id: 字符串类型
    • sketch: 图像类型
    • source_html: 字符串类型
    • source_screenshot: 图像类型
  • 拆分:

    • train:
      • 样本数量: 731
      • 数据大小: 178,040,827 字节
  • 下载大小: 136,077,581 字节

  • 数据集大小: 178,040,827 字节

配置

  • config_name: default
    • data_files:
      • split: train
      • path: data/train-*

数据集描述

  • Sketch2Code 数据集包含 731 个人类绘制的草图,与 484 个来自 Design2Code 数据集 的真实网页配对。
  • 该数据集用于基准测试视觉-语言模型 (VLMs) 将基本草图转换为网页设计原型的能力。
  • 所有网页中的图像均被替换为蓝色占位图像 (rick.jpg)。
搜集汇总
数据集介绍
main_image_url
构建方式
Sketch2Code数据集通过整合人类绘制的草图与真实网页设计,构建了一个用于视觉语言模型(VLMs)的基准测试平台。该数据集包含了731幅手绘草图,并与来自Design2Code数据集的484个真实网页进行配对。在数据处理过程中,所有网页中的图像均被替换为统一的蓝色占位符图像,以确保数据的一致性和简化模型训练过程。
特点
Sketch2Code数据集的核心特点在于其独特的草图与网页设计配对结构,为视觉语言模型提供了从草图到网页原型转换的丰富训练素材。数据集中的每一条记录均包含草图和对应的网页HTML代码及截图,使得模型能够在多模态数据上进行学习。此外,数据集中的图像统一处理为占位符,减少了无关变量对模型训练的干扰,提升了模型的泛化能力。
使用方法
Sketch2Code数据集主要用于训练和评估视觉语言模型在草图到网页设计转换任务中的表现。研究人员可以通过加载数据集的训练集,利用草图和对应的网页HTML代码进行模型训练。在评估阶段,模型生成的网页设计可以与真实网页进行对比,以衡量其准确性和实用性。数据集的使用方法简单直观,支持通过Hugging Face平台直接下载和加载,便于快速开展相关研究。
背景与挑战
背景概述
Sketch2Code-hf数据集由SALT-NLP团队于近期发布,旨在为视觉语言模型(VLMs)提供从手绘草图到网页设计原型的转换基准。该数据集包含731张手绘草图与484个真实网页的配对,源自Design2Code数据集。其核心研究问题在于如何通过机器学习和计算机视觉技术,将人类绘制的简单草图自动转化为功能性的网页设计原型。这一研究不仅推动了视觉语言模型在多模态任务中的应用,也为网页设计自动化提供了新的研究方向。
当前挑战
Sketch2Code-hf数据集在解决网页设计自动化问题时面临多重挑战。首要挑战在于如何准确理解手绘草图的语义信息,并将其映射为复杂的网页结构。手绘草图的多样性和模糊性增加了模型训练的难度。其次,构建过程中需确保数据集的高质量与多样性,以覆盖不同设计风格和网页布局。此外,数据集中所有网页图像被替换为占位符图像,这虽然简化了数据处理,但也可能影响模型对真实场景的泛化能力。这些挑战共同构成了该数据集在推动网页设计自动化领域发展的关键障碍。
常用场景
经典使用场景
Sketch2Code数据集在视觉语言模型(VLMs)的研究中扮演着关键角色,主要用于将手绘草图转化为网页设计原型。这一过程不仅测试了模型对图像和文本的理解能力,还推动了自动化设计工具的发展。
实际应用
在实际应用中,Sketch2Code数据集被广泛用于开发自动化网页设计工具。这些工具能够帮助设计师快速将概念草图转化为可操作的网页代码,极大地提高了设计效率和一致性,尤其在快速迭代和原型设计中显示出其独特价值。
衍生相关工作
基于Sketch2Code数据集,多项研究工作得以展开,包括改进的视觉语言模型和更高效的草图识别算法。这些研究不仅推动了相关技术的发展,还为未来的自动化设计工具提供了新的思路和方法,进一步拓展了该领域的应用前景。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作