DLC_512x256
收藏数据集概述:Compositional Discrete Latent Code for High Fidelity, Productive Diffusion Models
数据集简介
- 作者: Samuel Lavoie, Michael Noukhovitch, Aaron Courville
- 核心内容: 引入组合离散潜在代码(DLCs),支持扩散模型中的高保真图像生成和组合生成。
📁 DLC数据集
- 数据集名称: ImageNet as 512x256 DLCs
- 描述: 通过SEM-DinoV2模型编码ImageNet并提取DLC生成的数据集。
- 数据集链接: lavoies/DLC_512x256
- 使用方法: python from datasets import load_dataset dataset = load_dataset("lavoies/DLC_512x256", split="train") features = dataset[0][features] dlc = dataset[0][labels]
📀 预训练模型
预训练SEM编码器
- 模型名称: SEM_dinov2_L512
- DLC形状: 512x256
- ImageNet1k线性探测准确率: 85.3
- 模型链接: lavoies/SEM_dinov2_L512
- 使用方法: python from transformers import AutoImageProcessor, AutoModel processor = AutoImageProcessor.from_pretrained(lavoies/SEM_dinov2_L512, trust_remote_code=True) model = AutoModel.from_pretrained(lavoies/SEM_dinov2_L512, trust_remote_code=True)
预训练DLC-SEDD
- 模型名称: DLC_SEDD_L512
- DLC形状: 512x256
- 模型链接: lavoies/DLC_SEDD_L512
- 使用方法: python from transformers import AutoModel model = AutoModel.from_pretrained(lavoies/DLC_SEDD_L512, trust_remote_code=True)
预训练DLC-DiT
- 模型名称: DLC_DiT_L512
- DLC形状: 512x256
- 模型链接: lavoies/DLC_DiT_L512
- 使用方法: python from ditpipeline_dlc_dit import DLCDiTPipeline pipe = DLCDiTPipeline.from_pretrained(lavoies/DLC_DiT_L512, trust_remote_code=True)
微调文本和DLC LLADA模型
- 模型名称: DLC_LLADA_L512
- DLC形状: 512x256
- 模型链接: lavoies/DLC_LLADA_L512
- 使用方法: python from transformers import AutoModel model = AutoModel.from_pretrained(lavoies/DLC_LLADA_L512, trust_remote_code=True)
生成方法
无条件生成
bash python sedd/run_sample.py --sample_dir . --model_path lavoies/DLC_SEDD_L512 --batch_size 32 --steps 512 --total_samples 32 --save_name uncond python dit/sample_sem.py --model lavoies/DLC_DiT_L512 --cfg-scale 1.5 --image-size 256 --sem-path diffused_SEMs/uncond.pt
文本到图像生成
bash PROMPT="An image of a golden retriever" python dit/chat_sem.py --model_name_or_path lavoies/DLC_LLADA_L512 --output_path golden.pt --remasking random --L 512 --V 256 --temperature 0.2 --steps 512 --num_samples 3 --prompt="$PROMPT" python dit/sample_sem.py --model lavoies/DLC_DiT_L512 --cfg-scale 3 --image-size 256 --sem-path golden.pt
语义组合生成
bash python dit/sample_comp_imgs.py --temp 0.001 --cfg-scale 3.5 --class-id n07734744_10099,n01910747_10038 --seed 0
参考文献




