Leuven Art Personalized Image Set (LAPIS)

Name: Leuven Art Personalized Image Set (LAPIS)
Creator: 荷兰莱顿大学
Published: 2025-04-10 19:42:56
License: 暂无描述

arXiv2025-04-10 更新2025-04-12 收录

下载链接：

https://github.com/Anne-SofieMaerten/LAPIS

下载链接

链接失效反馈

官方服务：

资源简介：

LAPIS是一个由荷兰莱顿大学创建的个性化图像美学评估数据集，包含11723幅画作图像。这些图像经过精心策划，并与艺术史学家合作标注，每幅图像都有美学评分和相关属性。数据集不仅包含丰富的图像属性，还提供了每位注释者的丰富个人属性，以供个性化预测。LAPIS的创建旨在解决个性化图像美学评估问题，特别是在艺术画作领域的评估。

LAPIS is a personalized image aesthetic assessment dataset created by Leiden University in the Netherlands, containing 11,723 paintings. These images are carefully curated and annotated in collaboration with art historians, with each image paired with aesthetic ratings and associated attributes. Beyond rich image attributes, the dataset also provides detailed personal attributes of each annotator to facilitate personalized prediction tasks. LAPIS was developed to address the problem of personalized image aesthetic assessment, particularly in the domain of artistic paintings.

提供机构：

荷兰莱顿大学

创建时间：

2025-04-10

搜集汇总

数据集介绍

构建方式

LAPIS数据集作为首个面向个性化图像美学评估的艺术作品数据集，其构建过程体现了跨学科合作的严谨性。研究团队从WikiArt在线艺术档案中精选了11,723幅涵盖26种艺术风格和7种主题类别的画作，通过与艺术史学家协作完成双重质量校验：人工剔除包含水印、雕塑等非目标样本，并采用自动化脚本移除重复图像及画框干扰。每幅图像由平均24名经过筛选的标注者通过在线实验平台进行美学评分，采用0-100视觉模拟量表并设置中间刻度锚点以降低极端评分偏差。数据集创新性地整合了31类计算图像属性（如亮度熵、分形维度）和丰富的标注者个人属性（艺术兴趣指数、人口统计学特征），构建了多维度的美学评估框架。

使用方法

该数据集支持两种典型的应用范式：在通用图像美学评估（GIAA）任务中，建议采用分层抽样划分训练/验证/测试集（70/10/20），确保风格与美学分数的均衡分布。对于个性化评估（PIAA），研究者可采用两种实验方案：传统方案允许标注者ID在训练测试集重叠，适合研究已知用户的偏好建模；而4折交叉验证方案严格隔离训练测试集的标注者，更能检验模型对新用户的泛化能力。实验表明，引入艺术兴趣等个人属性可使预测性能提升12.7%（SROCC）。针对算法开发，团队推荐优先融合风格标签与艺术兴趣特征，因消融实验证明这两类特征对模型性能影响最大（ΔSROCC>0.14）。所有图像元数据与计算特征均以结构化格式存储，并附有详细的分布可视化报告辅助数据采样。

背景与挑战

背景概述

Leuven Art Personalized Image Set (LAPIS) 是由比利时鲁汶大学脑与认知系与艺术史系合作构建的首个面向个性化图像美学评估(PIAA)的艺术作品数据集，发布于2025年。该数据集包含11,723幅经过艺术史专家精心筛选的画作图像，每幅图像均附有美学评分及与美学欣赏相关的图像属性。LAPIS创新性地整合了丰富的个人属性数据，包括评分者的艺术兴趣、熟悉度等心理学特征，突破了传统美学评估数据集仅关注通用美学评分(GIAA)的局限。作为计算美学领域的重要突破，LAPIS为艺术图像美学评估(AIAA)建立了新标准，其高质量标注数据显著提升了GIAA模型的性能，同时为探索个性化美学预测中的个体差异提供了重要平台。

当前挑战

LAPIS面临的核心挑战体现在两个维度：在领域问题层面，艺术图像美学评估存在显著高于自然图像的主观差异性，现有PIAA模型在交叉验证中性能显著下降，揭示了对未见用户泛化能力的不足；同时抽象艺术作品较具象作品引发更大评分分歧，模型对抽象风格的预测误差更高。在构建过程层面，艺术作品的复杂特性带来独特挑战：需人工校正WikiArt源数据中的风格标签不准确问题，通过多阶段质量检查排除非绘画类作品和水印图像；评分者招募需平衡艺术专家与普通人群比例，而年轻用户占比过高导致模型对年长用户预测性能下降；此外，自动化处理框架检测与艺术史专家人工校验的结合，增加了数据清洗的复杂度。

常用场景

经典使用场景

LAPIS数据集在计算美学领域具有开创性意义，其最经典的使用场景在于个性化图像美学评估（PIAA）研究。该数据集通过精心策划的艺术作品图像和丰富的注释者个人属性，为研究者提供了探索美学主观性的理想平台。在计算机视觉与心理学交叉研究中，LAPIS常被用于构建能够预测个体审美偏好的深度学习模型，尤其擅长捕捉艺术图像相较于自然图像更强的个体差异特征。

解决学术问题

LAPIS有效解决了艺术图像美学评估中个体差异建模的关键学术问题。传统数据集通常将个体差异视为噪声并计算平均美学分数，而LAPIS通过包含每位注释者的详细个人属性（如艺术兴趣、年龄等）和图像属性（如风格、色彩特征等），使得研究者能够深入探究主观审美偏好的形成机制。该数据集特别弥补了现有PIAA数据集中艺术图像缺失的空白，为理解抽象艺术作品与具象作品的美学评价差异提供了实证基础。

实际应用

在实际应用层面，LAPIS数据集推动了在线艺术交易平台的个性化推荐系统发展。通过分析用户对特定艺术风格的历史评分数据，结合个人属性特征，可构建精准的审美偏好预测模型。该技术已被应用于智能艺术创作工具的交互设计，如根据用户个性特征调整DALL-E等生成模型的输出风格。此外，画廊数字化策展中也开始采用类似技术优化虚拟展览的参观体验。

数据集最近研究