dlfelps/cub2011-latent-64
收藏Hugging Face2024-06-27 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/dlfelps/cub2011-latent-64
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了通过CUB2011图像生成的潜在向量。这些图像首先被重新采样为512x512大小,然后使用AutoencoderKL模型进行编码,生成64x64大小、4通道的潜在向量。数据集的特征包括标签和潜在向量,标签对应的是不同种类的鸟类名称。数据集主要用于无条件图像生成任务。
This dataset includes the latent vectors calculated from CUB2011 images. The images were resampled to 512x512 and then encoded using the AutoencoderKL model to produce 64x64 latent vectors with 4 channels. The features of the dataset include labels and latent vectors, where the labels correspond to different bird species. The dataset is primarily used for unconditional image generation tasks.
提供机构:
dlfelps
原始信息汇总
数据集概述
数据集信息
- 数据集名称: cub2011-latent-64
- 数据集大小: 784939344 字节
- 下载大小: 363204712 字节
- 样本数量: 11788
- 类别数量: 200
数据集特征
- 特征:
- label: 类别标签,包含200种不同的鸟类。
- latent: 潜在向量,类型为float32。
数据集配置
- 配置名称: default
- 数据文件路径: data/train-*
数据集任务
- 任务类别: 无条件图像生成 (unconditional-image-generation)
数据集使用
-
加载方式: python from diffusers import AutoencoderKL import torch
vae = AutoencoderKL.from_pretrained("runwayml/stable-diffusion-v1-5", subfolder="vae", torch_dtype=torch.float16) dataset.set_format(torch, columns=[latent], output_all_columns=True)



