Expert-labeled Aesthetics Perception Database (EAPD)
收藏arXiv2024-01-16 更新2024-06-21 收录
下载链接:
https://github.com/yipoh/AesBench
下载链接
链接失效反馈官方服务:
资源简介:
Expert-labeled Aesthetics Perception Database (EAPD)是由西安电子科技大学构建的高质量图像数据库,包含2800张多样化的图像,涵盖自然图像、艺术图像和人工智能生成的图像。该数据集由美学领域的专业专家进行高质量标注,旨在通过精细的设计全面评估多模态大型语言模型(MLLMs)的美学感知能力。EAPD不仅用于评估MLLMs在美学感知、共鸣、评估和解释四个方面的能力,还推动了智能摄影、相册管理、照片推荐和图像增强等应用领域的发展。
The Expert-labeled Aesthetics Perception Database (EAPD) is a high-quality image database constructed by Xidian University. It contains 2800 diverse images covering natural images, artistic images, and AI-generated images. Annotated by professional experts in the aesthetics field with high-quality annotations, this dataset aims to comprehensively evaluate the aesthetic perception capabilities of Multimodal Large Language Models (MLLMs) through elaborate design. EAPD is not only utilized to assess MLLMs' capabilities in four aspects: aesthetic perception, resonance, evaluation, and interpretation, but also promotes the development of application domains such as intelligent photography, album management, photo recommendation, and image enhancement.
提供机构:
西安电子科技大学
创建时间:
2024-01-16
搜集汇总
数据集介绍

构建方式
Expert-labeled Aesthetics Perception Database (EAPD) 的构建过程分为三个主要阶段:数据收集、专家选择和主观实验。首先,从多个数据集中收集了2800张多样化的图像,涵盖自然图像、艺术图像和人工智能生成的图像。随后,通过严格的筛选标准招募了32位具有丰富美学经验的专家。最后,这些专家使用本地部署的注释工具对图像进行高质量的注释,确保了数据集的可靠性和多样性。
特点
EAPD 数据集的显著特点在于其高质量的专家注释和图像内容的多样性。每张图像都由专业的美学专家进行注释,确保了注释的准确性和深度。此外,数据集包含了自然图像、艺术图像和人工智能生成的图像,提供了广泛的美学感知评估场景,使得该数据集在多模态大语言模型(MLLMs)的美学感知能力评估中具有重要价值。
使用方法
EAPD 数据集主要用于评估多模态大语言模型(MLLMs)在图像美学感知方面的能力。通过提供高质量的专家注释,研究人员可以利用该数据集来测试和提升模型在美学感知、美学共情、美学评估和美学解释四个维度上的表现。此外,数据集的多样性也使得其适用于不同类型的图像美学感知研究,为模型的进一步优化和应用提供了坚实的基础。
背景与挑战
背景概述
在多模态大语言模型(MLLMs)的蓬勃发展背景下,图像美学感知能力的评估成为一个亟待解决的问题。Expert-labeled Aesthetics Perception Database (EAPD) 由西安电子科技大学和南洋理工大学的研究团队于2024年创建,旨在为MLLMs在图像美学感知任务上的表现提供一个高质量的基准。该数据集包含了2800张多样化的图像,涵盖自然图像、艺术图像和人工智能生成的图像,并由专业美学专家进行高质量标注。EAPD的构建不仅填补了MLLMs在美学感知评估上的空白,还推动了智能摄影、相册管理和图像增强等实际应用的发展。
当前挑战
EAPD在构建过程中面临多重挑战。首先,图像内容的多样性和高质量标注的获取是主要难题,需要专业美学专家的参与。其次,MLLMs在美学感知任务上的表现仍处于初级阶段,与人类水平存在显著差距。此外,现有的评估标准主要集中在语言或视觉任务上,缺乏针对美学感知任务的专门基准。最后,如何准确评估MLLMs在美学感知任务上的表现,尤其是在情感共鸣、美学评估和解释等方面的能力,仍是一个开放的研究问题。
常用场景
经典使用场景
Expert-labeled Aesthetics Perception Database (EAPD) 最经典的使用场景在于评估多模态大语言模型(MLLMs)在图像美学感知任务中的表现。通过提供多样化且高质量的图像内容和专业美学专家的标注,EAPD 能够全面评估 MLLMs 在美学感知、共情、评估和解释四个维度上的能力。这种评估不仅有助于揭示当前 MLLMs 在美学感知方面的局限性,还为未来模型的改进提供了宝贵的数据支持。
实际应用
在实际应用中,EAPD 可以广泛应用于智能摄影、相册管理、照片推荐和图像增强等领域。通过评估和提升 MLLMs 在美学感知方面的能力,EAPD 有助于开发出更智能、更符合人类审美的图像处理工具。例如,在智能摄影中,EAPD 可以帮助相机自动调整拍摄参数以捕捉更具美感的照片;在相册管理中,EAPD 可以用于自动分类和推荐高美感的照片。
衍生相关工作
EAPD 的推出催生了大量相关研究工作,特别是在多模态大语言模型的美学感知能力评估和改进方面。例如,基于 EAPD 的研究已经提出了多种新的评估标准和方法,如 AesBench 中的四维度评估框架。此外,EAPD 还激发了在图像美学感知任务中应用 GPT 辅助评估策略的研究,进一步提升了评估的准确性和可靠性。这些衍生工作不仅丰富了美学感知领域的研究内容,也为实际应用提供了技术支持。
以上内容由遇见数据集搜集并总结生成



