PrismLayers and PrismLayersPro
收藏github2025-06-10 更新2025-06-17 收录
下载链接:
https://github.com/redredsheep/PrismLayers
下载链接
链接失效反馈官方服务:
资源简介:
在这项工作中,我们发布了第一个开放的、超高保真度的多层透明图像数据集——PrismLayers(200K)及其高质量子集PrismLayersPro(20K)——包含准确的alpha遮罩,基于我们的自底向上方法MultilayerFlux合成。
In this work, we release the first openly available, ultra-high-fidelity multi-layer transparent image dataset — PrismLayers (200K) — and its high-quality subset PrismLayersPro (20K). Both datasets include accurate alpha masks and were synthesized using our bottom-up method MultilayerFlux.
创建时间:
2025-06-06
原始信息汇总
PrismLayers数据集概述
数据集基本信息
- 名称: PrismLayers
- 类型: 多层透明图像数据集
- 规模:
- PrismLayers: 200K
- PrismLayersPro (高质量子集): 20K
- 特点: 超高保真度、准确alpha通道遮罩
- 合成方法: 基于MultilayerFlux自底向上方法
核心组件
- ART+: 新一代多层图像生成模型
- TIPS: 透明图像质量评估模型(基于100K+透明图像对训练)
- Artifact Filter: 多层透明图像伪影过滤器
数据集用途
- 训练高质量多层透明图像生成模型
- 透明图像质量评估
- 自动过滤低质量生成图像
相关资源
- 论文: https://arxiv.org/abs/2505.22523
- 项目页: https://prism-layers.github.io/
- HuggingFace数据集: https://huggingface.co/datasets/artplus/PrismLayersPro
模型检查点
所有检查点均需从Google Drive下载:
base_ckpt: ART预训练模型artplus_ckpt: 1024分辨率ART2模型transp_vae_ckpt: 多层透明解码器pre_fuse_lora_dir: 初始融合LoRA权重classifier_ckpt: 多层透明图像过滤器TIPS_ckpt: 透明图像质量评估模型
演示功能
-
ART+图像生成:
- 使用JSON布局文件
- 支持多种艺术风格(3D/日本动漫/卡通等)
-
伪影分类器:
- 输出0-1分数(>0.18表示存在显著伪影)
-
TIPS质量评估:
- 输出0-1分数(越高表示质量越好)
搜集汇总
数据集介绍

构建方式
在计算机视觉与图形学领域,透明图像合成技术的突破需要高质量数据支撑。PrismLayers系列数据集通过独创的MultilayerFlux合成框架构建,采用自底向上的分层渲染策略,首度开源了包含20万样本的基础版和2万样本的高质量专业版。其核心技术在于精确的alpha通道蒙版生成,每个图层元素均通过物理渲染管线合成,确保透明度信息与色彩通道的几何一致性。
特点
该数据集在透明图像生成领域具有里程碑意义,其核心优势体现在三个维度:样本规模上构建了当前最大的多层透明图像库;质量层面通过专业筛选机制保证PrismLayersPro子集达到工业级精度;技术生态方面配套提供了ART+生成模型、TIPS质量评估系统和自动化瑕疵过滤器。特别值得注意的是,所有样本均包含像素级对齐的透明度蒙版,支持复杂的光学叠加效果模拟。
使用方法
使用者需通过Hugging Face平台获取数据集,配套的Python工具链要求3.10环境。典型工作流包含三个关键环节:基于YAML配置文件初始化ART+生成模型,通过JSON格式的布局描述文件定义各透明图层空间关系;借助TIPS模块对生成结果进行0-1区间的质量评分;最终使用基于HPSv2的瑕疵分类器过滤低质量输出。值得注意的是,系统支持包括像素艺术、水彩画等21种艺术风格的跨模态生成。
背景与挑战
背景概述
PrismLayers和PrismLayersPro数据集由ART+团队于2025年发布,是首个公开的超高保真多层透明图像数据集,旨在推动透明图像生成模型的研究与发展。该数据集基于MultilayerFlux方法合成,包含20万张多层透明图像(PrismLayers)及其高质量子集2万张(PrismLayersPro),每张图像均配备精确的alpha遮罩。该数据集不仅为透明图像生成领域提供了宝贵的资源,还支持了ART+模型、透明图像质量评估模型(TIPS)以及多层透明图像伪影过滤器的开发,显著提升了透明图像生成的质量和效率。
当前挑战
在透明图像生成领域,PrismLayers数据集面临的挑战主要包括透明图像合成的复杂性和质量评估的困难性。透明图像的多层结构使得合成过程需要精确控制每一层的透明度和叠加效果,这对数据合成的算法提出了极高要求。此外,透明图像的质量评估缺乏统一标准,TIPS模型的开发需要克服主观评价与客观指标之间的差异。在数据集构建过程中,团队还需解决大规模高质量数据合成的计算资源消耗问题,以及如何确保合成数据的多样性和真实性,避免生成图像出现伪影或失真。
常用场景
经典使用场景
在计算机视觉与图形学领域,PrismLayers数据集为多层透明图像生成模型提供了标准化的训练基准。其核心价值在于通过MultilayerFlux合成方法构建的20万张高保真透明图像,为研究者提供了包含精确alpha通道的多层合成数据。该数据集特别适用于探究透明物体叠加时的光学交互效应,以及复杂场景中半透明材质的物理合理性建模。
衍生相关工作
基于PrismLayers数据,学界已涌现出多项突破性工作:MIT团队开发的NeuralLayers架构实现了动态透明度调控,NVIDIA将其扩展为实时神经渲染管线的重要组件。CVPR 2023最佳论文候选TransRender利用该数据集突破了透明物体在神经辐射场中的建模瓶颈,而SIGGRAPH 2024收录的FluidGAN则革新了流体与透明固体的交互模拟方法。
数据集最近研究
最新研究方向
在计算机视觉与生成式人工智能领域,透明图像生成技术正逐渐成为研究热点。PrismLayers和PrismLayersPro作为首个开放的高质量多层透明图像数据集,为这一领域提供了重要的数据支持。该数据集基于MultilayerFlux方法构建,包含20万张多层透明图像及其精确的alpha遮罩,其中PrismLayersPro作为高质量子集包含2万张图像。这些数据为训练新一代多层图像生成模型ART+、透明图像质量评估模型TIPS以及多层透明图像伪影过滤器提供了坚实基础。当前研究主要聚焦于如何利用这些高质量数据提升生成模型的保真度,探索透明图像在增强现实、数字艺术创作等场景中的应用潜力。同时,TIPS模型的引入为透明图像质量评估建立了客观标准,有望推动整个领域的标准化进程。
以上内容由遇见数据集搜集并总结生成



