five

silatus/1k_Website_Screenshots_and_Metadata

收藏
Hugging Face2023-01-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/silatus/1k_Website_Screenshots_and_Metadata
下载链接
链接失效反馈
官方服务:
资源简介:
Silatus公司免费分享了一部分用于训练生成式AI模型的数据集,该模型用于文本到模拟图的转换。此数据集收集于2022年12月和2023年1月初,包含了1000个世界最流行网站的非常新的数据。数据集包括高分辨率截图(1024x1024像素,加载了Javascript和图像)、文本元数据(网站标题、导航栏内容、完整页面文本数据、页面描述)和视觉元数据(内容如图片、视频、输入框、按钮的绝对和相对位置、颜色配置、基础字体)。
提供机构:
silatus
原始信息汇总

数据集概述

基本信息

  • 名称: 1000 Website Screenshots with Metadata
  • 许可证: cc-by-nc-sa-4.0
  • 语言: 英语
  • 标签:
    • 截图
    • 元数据
    • 网站
    • 网页
  • 任务类别:
    • 文本到图像
    • 图像分类
    • 图像分割
  • 大小类别: 1K<n<10K

数据集内容

  • 截图:
    • 分辨率: 1024x1024px
    • 包含: Javascript, 图像
  • 文本元数据:
    • 网站标题
    • 导航栏内容
    • 全页文本数据
    • 页面描述
  • 视觉元数据:
    • 内容位置 (绝对 & 相对)
    • 颜色配置文件
    • 基础字体

数据集用途

用于训练生成AI模型,特别是文本到模拟图转换的模型。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作