APDDv2|艺术图像数据集|美学评估数据集

arXiv2024-11-13 更新2024-11-15 收录

艺术图像

美学评估

下载链接：

https://github.com/BestiVictory/APDDv2.git

下载链接

链接失效反馈

资源简介：

APDDv2（Aesthetics of Paintings and Drawings Dataset）是由北京电子科技学院等机构创建的综合性绘画和素描数据集，包含24个不同的艺术类别和10个美学属性。数据集包含10,023张图像，超过90,000个标注，包括详细的语言评论。数据集的创建过程涉及与中央美术学院的专业艺术家合作，通过多层次的评估标准和详细的标注过程，确保了数据集的高质量和丰富性。该数据集主要用于训练美学模型，旨在解决艺术图像的自动美学评估问题，为艺术图像分析和研究提供了一个可靠的基础。

提供机构：

北京电子科技学院、北京通用人工智能研究院、中央美术学院、中国科学技术大学、北京工业大学

创建时间：

2024-11-13

AI搜集汇总

数据集介绍

构建方式

在艺术美学评估领域，高质量的数据集构建尤为关键。APDDv2数据集的构建过程凝聚了多方专家的智慧与努力。首先，数据集从多个专业艺术网站和机构中精心挑选了10,023幅绘画作品，涵盖24种艺术类别。随后，通过与中央美术学院的专业艺术家合作，确定了10种美学属性，并制定了详细的评分标准。为了确保评分的准确性和一致性，数据集引入了详细的语言评论，并由37位来自不同专业背景的专家组成的标注团队进行评分和评论。这一过程不仅确保了数据集的多样性和代表性，还为后续的研究提供了坚实的基础。

使用方法

APDDv2数据集的应用广泛且灵活。首先，研究人员可以利用该数据集训练和验证美学评估模型，特别是针对艺术作品的特定风格和属性。其次，数据集中的详细语言评论可以用于情感分析和文本生成任务，帮助理解观众对艺术作品的情感反应。此外，APDDv2还可以用于开发和测试多模态学习模型，结合视觉和文本信息进行更深入的艺术分析。数据集的开放性和详细标注使其成为艺术美学研究的重要工具，支持从基础研究到应用开发的多种需求。

背景与挑战

背景概述

在计算机视觉领域，图像美学质量评估（IAQA）任务旨在通过计算机视觉技术自动评估图像的美学质量。尽管在摄影领域已有大量数据集，但在绘画领域，高质量的数据集仍然稀缺。APDDv2数据集由北京电子科学技术研究所、北京通用人工智能研究所、中央美术学院、中国科学技术大学和北京工业大学联合开发，旨在填补这一空白。该数据集首次全面收集了涵盖24种不同艺术类别和10种美学属性的绘画作品，通过详细的语言注释和评分，为研究人员和从业者提供了高质量的绘画数据集。APDDv2的构建不仅扩展了数据规模，还提升了注释的精确度，为艺术图像的美学评估提供了坚实的基础。

当前挑战

APDDv2数据集在构建过程中面临多重挑战。首先，艺术图像的多样性和复杂性使得数据集的构建需要细致考虑不同风格、主题和技术的影响。其次，美学评估的主观性要求注释者具备专业知识和艺术背景，这增加了数据集构建的难度。此外，尽管APDDv2在数据规模和注释质量上有所提升，但仍需进一步扩展以涵盖更多艺术风格和审美偏好，特别是新兴和少数艺术流派。未来，数据集的扩展还需考虑不同文化背景下的审美差异，以确保其在全球范围内的适用性。

常用场景

经典使用场景

APDDv2数据集在艺术图像美学评估领域中扮演着至关重要的角色。其经典使用场景主要集中在训练和验证自动美学评估模型上，这些模型能够对绘画和素描作品进行多维度的美学评分和详细的语言评论。通过提供丰富的图像样本和多层次的属性标注，APDDv2数据集支持研究人员开发和优化能够捕捉艺术作品美学特征的深度学习模型，从而推动图像美学质量评估技术的发展。

解决学术问题

APDDv2数据集解决了艺术图像美学评估领域中长期存在的数据稀缺和标注不足的问题。通过提供超过10,000张图像和详细的评分及评论，该数据集为学术研究提供了丰富的资源，使得研究人员能够更深入地探索艺术作品的美学属性和评估标准。这不仅促进了美学评估模型的创新，还为跨学科研究提供了坚实的基础，推动了计算机视觉与艺术美学的交叉研究。

实际应用

在实际应用中，APDDv2数据集及其衍生的模型ArtCLIP被广泛应用于艺术教育和艺术创作领域。例如，在艺术教育中，教师可以利用ArtCLIP模型对学生的作品进行自动评估，提供个性化的反馈和指导。在艺术创作中，艺术家和设计师可以使用该模型来优化他们的作品，确保其美学质量符合专业标准。此外，该数据集还支持艺术市场的自动化评估，帮助收藏家和画廊更科学地进行艺术品选择和定价。

数据集最近研究

相关研究论文

1
APDDv2: Aesthetics of Paintings and Drawings Dataset with Artist Labeled Scores and Comments北京电子科技学院、北京通用人工智能研究院、中央美术学院、中国科学技术大学、北京工业大学 · 2024年

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像，每张图像均给出对应的人名，共有5749人，且绝大部分人仅有一张图片。每张图片的尺寸为250X250，绝大部分为彩色图像，但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成，包含74万篇新闻文档（2.19 GB），均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上，重新整合划分出14个候选分类类别：财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录

Houston2013, Berlin, Augsburg

本研究发布了三个多模态遥感基准数据集：Houston2013（高光谱和多光谱数据）、Berlin（高光谱和合成孔径雷达数据）和Augsburg（高光谱、合成孔径雷达和数字表面模型数据）。这些数据集用于土地覆盖分类，旨在通过共享和特定特征学习模型（S2FL）评估多模态基线。数据集包含不同模态和分辨率的图像，适用于评估和开发新的遥感图像处理技术。

arXiv 收录

THCHS-30

“THCHS30是由清华大学语音与语言技术中心（CSLT）发布的开放式汉语语音数据库。原始录音是2002年在清华大学国家重点实验室的朱晓燕教授的指导下，由王东完成的。清华大学计算机科学系智能与系统，原名“TCMSD”，意思是“清华连续普通话语音数据库”，时隔13年出版，由王东博士发起，并得到了教授的支持。朱小燕。我们希望为语音识别领域的新研究人员提供一个玩具数据库。因此，该数据库对学术用户完全免费。整个软件包包含建立中文语音识别所需的全套语音和语言资源系统。”

OpenDataLab 收录

中国100m人口密度数据集（2000-2020年）

本数据集为中国100m人口密度数据集，数据来源于WorldPop平台，该数据集为UN-adjusted 且 Constrained 版本。数据集按照年份共计包含21个tif栅格数据，worldpop-year-merged.tif。

国家地球系统科学数据中心收录