silatus/1k_Website_Screenshots_and_Metadata
收藏Hugging Face2023-01-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/silatus/1k_Website_Screenshots_and_Metadata
下载链接
链接失效反馈官方服务:
资源简介:
Silatus公司免费分享了一部分用于训练生成式AI模型的数据集,该模型用于文本到模拟图的转换。此数据集收集于2022年12月和2023年1月初,包含了1000个世界最流行网站的非常新的数据。数据集包括高分辨率截图(1024x1024像素,加载了Javascript和图像)、文本元数据(网站标题、导航栏内容、完整页面文本数据、页面描述)和视觉元数据(内容如图片、视频、输入框、按钮的绝对和相对位置、颜色配置、基础字体)。
提供机构:
silatus
原始信息汇总
数据集概述
基本信息
- 名称: 1000 Website Screenshots with Metadata
- 许可证: cc-by-nc-sa-4.0
- 语言: 英语
- 标签:
- 截图
- 元数据
- 网站
- 网页
- 任务类别:
- 文本到图像
- 图像分类
- 图像分割
- 大小类别: 1K<n<10K
数据集内容
- 截图:
- 分辨率: 1024x1024px
- 包含: Javascript, 图像
- 文本元数据:
- 网站标题
- 导航栏内容
- 全页文本数据
- 页面描述
- 视觉元数据:
- 内容位置 (绝对 & 相对)
- 颜色配置文件
- 基础字体
数据集用途
用于训练生成AI模型,特别是文本到模拟图转换的模型。



