MrOvkill/housey-home-v2
收藏Hugging Face2024-07-15 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/MrOvkill/housey-home-v2
下载链接
链接失效反馈官方服务:
资源简介:
Housey Home v2数据集是一个用于文本到图像和无条件图像生成的合成数据集。该数据集包含3032个训练样本,每个样本包括图像、提示、哈希值、生成方式、数量、背景类型、是否有邻居、风格和大小等信息。数据集是通过一种非常规的层次组合生成的,旨在为未接地的图像生成提供一个完全合成的数据集。数据集中的每个房子都经过VQA处理,使用了ybelkada/blip-vqa-base模型。此外,数据集还提供了一段代码,用于基于输入的字符串选择列表生成简单的描述。
The Housey Home v2 dataset is a synthetic dataset for text-to-image and unconditional image generation tasks. It contains 3032 training samples, each including an image, prompt, hash, generation method, quantity, background type, presence of neighbors, style, and size. The dataset is generated using an unconventional combination of layers, aiming to provide a fully synthetic dataset for ungrounded image generation. Each house in the dataset is processed using a VQA model, specifically ybelkada/blip-vqa-base. Additionally, the dataset includes a code snippet for generating simple descriptions based on input lists of string selections.
提供机构:
MrOvkill
原始信息汇总
Housey Home v2 数据集概述
基本信息
- 语言: 英语
- 许可证: MIT
- 任务类别:
- 文本到图像生成
- 无条件图像生成
- 数据集名称: Housey Home v2
数据集结构
特征
- image: 图像数据
- prompt: 字符串,提示信息
- hash: 字符串,哈希值
- generated_by: 字符串,生成者信息
- quantity: 字符串,数量信息
- plain_background: 字符串,背景信息
- has_neighbors: 字符串,是否有邻居信息
- style: 字符串序列,风格信息
- size: 字符串序列,尺寸信息
数据分割
- train:
- 样本数量: 3032
- 数据大小: 873060466.6 字节
数据文件
- 配置名称: default
- 数据文件路径: data/train-*
数据集版本
- 初始版本: 包含约2000个独特的房屋,使用VQA模型处理。
- 第二版本: 包含约3000个独特的房屋,处理效率更高,使用更强大的GPU进行并行模型加载和加速推理。
数据生成
- 数据集通过程序化生成,基于输入的字符串选择列表。
- 生成的描述包括房屋的尺寸和风格信息。



