Lunara Aesthetic II

Name: Lunara Aesthetic II
Creator: 格里菲斯大学; 卡内基梅隆大学
Published: 2026-02-04 01:45:15
License: 暂无描述

arXiv2026-02-04 更新2026-02-05 收录

下载链接：

https://huggingface.co/datasets/moonworks/lunara-aesthetic-image-variations

下载链接

链接失效反馈

官方服务：

资源简介：

Lunara Aesthetic II是由Moonworks团队创建的高质量图像变体数据集，包含2854对锚定链接的图像变体，源自336幅原创艺术作品和照片。数据集通过光照、天气、视角等上下文变换保持核心身份不变，同时维持高美学评分。数据来源于明确授权的研究/商业用途内容，采用Apache 2.0许可发布，适用于图像生成和编辑模型的基准测试、微调及分析，旨在解决上下文泛化和身份保持等核心问题。

Lunara Aesthetic II is a high-quality image variant dataset developed by the Moonworks team. It contains 2,854 pairs of anchored linked image variants derived from 336 original artworks and photographs. The dataset preserves core visual identities through contextual transformations such as lighting conditions, weather variations, and camera viewpoints, while retaining high aesthetic ratings. All content in the dataset is sourced from explicitly authorized research and commercial use materials, and it is released under the Apache 2.0 license. This dataset is applicable to benchmark testing, fine-tuning, and analysis of image generation and editing models, aiming to address core issues such as contextual generalization and identity preservation.

提供机构：

格里菲斯大学; 卡内基梅隆大学

创建时间：

2026-02-02

原始信息汇总

数据集概述

基本信息

数据集名称: Moonworks Lunara Aesthetic II (Lunara Aesthetic Image Variations)
发布机构: Moonworks
许可证: Apache-2.0
标签: image-editing, image-variation, identity-preservation
任务类别: image-to-image, text-to-image
数据规模: 1K<n<10K
配置名称: default

数据内容与结构

数据总量: 2854 个样本
数据集大小: 8451541428.066 字节
下载大小: 2227202641 字节
数据分割: 仅包含训练集 (train)

特征字段

original_image: 原始图像
variant_image: 变体图像
semantic_category_changes: 语义类别更改序列 (string)
base_prompt: 基础提示词 (string)
variation_prompt: 变体提示词 (string)
variation_set: 变体集 (float32)
prompt_topic: 提示主题 (string)

数据集描述

该数据集是 Moonworks 的第二个开源版本，包含由 Moonworks 创作的原始图像和艺术作品，以及由 Moonworks Lunara（一个参数少于100亿、采用新型扩散混合架构的模型）生成的上下文变体。

第一部分旨在学习和评估区域及区域无关的艺术风格，第二部分旨在学习上下文变化的同时保持高审美价值。

第一部分地址: https://huggingface.co/datasets/moonworks/lunara-aesthetic

论文地址: https://arxiv.org/pdf/2602.01666

设计目的与用途

该数据集是一个紧凑的图像变体数据集，旨在研究图像编辑和图像到图像生成中的身份保持和上下文一致性。

每个样本包含：

一个原始锚点图像
一个具有受控上下文或审美变化的变体图像

预期用途

为图像编辑和图像变体模型提供基准测试
评估审美变化下的身份保持
对上下文转换进行定性分析
研究受控的图像到图像生成

引用信息

如果使用此数据集，请引用： bibtex @article{wang2026lunaraII, title={Moonworks Lunara Aesthetic II: An Image Variation Dataset}, author={Wang, Yan and Hassan, Partho and Sadeka, Samiha and Soliman, Nada and Abdullah, M M Sayeef and Hassan, Sabit}, journal={arXiv preprint arXiv:2602.01666}, year={2026} }

搜集汇总

数据集介绍

构建方式

在图像生成与编辑领域，对上下文一致性的评估需求日益增长，Lunara Aesthetic II数据集的构建旨在为此提供结构化监督信号。该数据集以336幅原创摄影与艺术作品为锚点，通过Moonworks Lunara扩散混合模型生成2,854个锚点关联的变体对，每个变体在保持核心身份不变的前提下，系统性地施加光照、天气、视角等六类上下文变换。构建过程融合了视觉语言模型的自动标注与人工验证，确保变体标签准确反映视觉差异，最终形成以身份保留为纽带的关联数据组，为模型学习上下文泛化提供可解释的关系监督。

使用方法

该数据集适用于图像生成与编辑系统的基准测试、微调及分析研究。用户可借助其锚点关联结构，评估模型在受控分布偏移下的泛化能力，探究记忆与捷径学习现象，并通过身份稳定性指标衡量编辑鲁棒性。数据集支持以变体组为单位进行上下文一致性分析，例如在保持场景核心身份的同时，检验光照或天气变换的属性实现准确性。其Apache 2.0许可促进了可重复研究，尤其适合小规模训练与适配研究，为上下文学习与身份保留提供了结构化评估框架。

背景与挑战

背景概述

在生成式人工智能迅猛发展的时代背景下，图像生成与编辑系统在遵循指令与视觉一致性方面取得了显著进步，然而高质量、高美学且具有明确监督信号的数据集仍相对匮乏。Lunara Aesthetic II数据集由Moonworks团队于2026年创建并公开发布，旨在为现代图像生成与编辑系统提供一种结构化的评估与学习资源。该数据集的核心研究问题聚焦于身份保持下的上下文一致性变换，即如何在改变光照、天气、视角、场景构图、色调或氛围等上下文属性的同时，稳固维持图像主体的内在身份。它包含2,854对锚点链接的变体图像对，均源自经过明确授权许可的原创艺术作品与摄影。与LAION-5B等追求规模覆盖的通用数据集不同，Lunara Aesthetic II通过其关系型数据结构，为模型在可控上下文泛化、身份保持与编辑鲁棒性方面的训练与评估提供了精准的监督信号，对推动生成模型超越表层记忆、实现真正的语义理解具有重要影响力。

当前挑战

Lunara Aesthetic II数据集致力于解决图像生成与编辑领域中身份保持上下文变换这一核心问题的挑战。具体而言，其旨在克服现有系统在实施复杂语义编辑时容易导致身份漂移或无意引入无关对象的难题，确保模型能够学习并泛化真实的上下文概念而非依赖表面视觉关联。在数据集构建过程中，团队面临多重挑战：首先，生成高质量变体需在精确实现目标属性变换与严格保持核心身份之间取得微妙平衡，这对生成模型的操控精度提出了极高要求。其次，对多种上下文变换维度进行标注与验证过程复杂，需要结合视觉语言模型自动分析与人工精细校验，以确保标签准确反映视觉变化。此外，数据集设计需处理不同变换维度之间的非平凡依赖关系，例如光照变化常与氛围、天气等其他编辑协同出现，这要求数据结构能有效表征此类组合性变换，同时维持各变换轴线的相对独立性，为模型提供清晰且无歧义的学习信号。

常用场景

经典使用场景

在生成式视觉模型的评估与训练领域，Lunara Aesthetic II数据集以其精心构建的锚点关联变体结构，为研究者提供了评估上下文一致性与身份保持能力的经典场景。该数据集通过系统性地改变光照、天气、视角等上下文属性，同时维持图像核心身份不变，使得模型能够在受控条件下学习语义转换的泛化能力，而非依赖表层视觉记忆。这种设计特别适用于图像生成与图像到图像转换系统的基准测试，为模型在真实世界场景下的鲁棒性提供了可解释的监督信号。

解决学术问题

该数据集有效应对了生成式人工智能中上下文泛化与身份保持的学术挑战。传统大规模图像文本数据集缺乏对身份一致性的显式监督，而Lunara Aesthetic II通过锚点关联的变体对，将身份保持的上下文变化操作化为监督信号。这使研究者能够深入探究模型是否真正掌握了上下文概念，而非仅仅学习到表面相关性，从而解决了在图像编辑与生成系统中评估记忆化、捷径学习以及受控分布偏移下泛化能力的核心问题。

实际应用

在实际应用层面，Lunara Aesthetic II为图像编辑软件、创意内容生成工具以及视觉特效系统提供了高质量的微调与评估数据。其高美学评分与身份保持特性，使得开发人员能够训练出在改变场景氛围或视觉风格时仍能保持主体一致性的模型。例如，在广告设计、影视后期或游戏资产生成中，该数据集支持创建在不同光照或天气条件下保持品牌标识或角色特征的视觉内容，提升了创作效率与输出可靠性。

数据集最近研究