PRINTART, Painting-91, Rijksmusem, Wikipaintings, Art 500K, SemArt, omniart, Web Gallery of Art, Wikiart, Mulitask Painting Collection, iMet Collection Dataset
收藏github2024-03-27 更新2024-05-31 收录
下载链接:
https://github.com/georgeblck/art-datasets
下载链接
链接失效反馈官方服务:
资源简介:
PRINTART - 988张图像,[[论文-2012]](https://link.springer.com/content/pdf/10.1007%2F978-3-642-33765-9_11.pdf) [[数据]](http://printart.isr.ist.utl.pt/database.html) 35次引用
Painting-91 - 4266张图像,[[论文-2014]](https://link.springer.com/article/10.1007/s00138-014-0621-6) [[数据]](http://www.cat.uab.cat/~joost/painting91.html) 86次引用
Rijksmusem - 3593幅画作/112039张图像,[[论文-2014]](https://dl.acm.org/doi/pdf/10.1145/2578726.2578791?download=true) [[数据]](https://figshare.com/articles/Rijksmuseum_Challenge_2014/5660617) [[代码]](https://github.com/tmensink/rijkschallenge) 60次引用
Art 500K - 约500,000张图像,[[论文]](https://dl.acm.org/doi/pdf/10.1145/3123266.3123405?download=true) [[数据+代码]](http://deepart2.ece.ust.hk/ART500K/art500k.html) 22次引用
SemArt - 21,383张图像,[[论文-2018]](http://noagarciad.com/docs/VISART2018.pdf) [[数据]](http://noagarciad.com/SemArt/) 11次引用
omniart - 2,050,017张图像,[[网站申请种子]](http://isis-data.science.uva.nl/strezoski/#3) [[论文]](https://dl.acm.org/doi/10.1145/3273022) 25次引用
Web Gallery of Art - 约19,000张图像
Wikiart - 约100,000张图像 **正在更新**,[[网站]](https://www.wikiart.org/) [[python爬虫]](https://github.com/lucasdavid/wikiart) [[现成源1]](https://github.com/rkjones4/GANGogh) [[现成源 #2]](https://github.com/cs-chan/ArtGAN/tree/master/WikiArt%20Dataset)
Mulitask Painting Collection - ,[[网站+下载]](http://www.ivl.disco.unimib.it/activities/paintings/) [[论文-2019]](https://arxiv.org/pdf/1812.08052.pdf) 1次引用
iMet Collection Dataset - 375,000张图像,[[论文]](https://arxiv.org/pdf/1906.00901.pdf) [[kaggle数据]](https://www.kaggle.com/c/imet-2019-fgvc6/overview)
PRINTART - 包含988张图像的数据集,源自[[论文-2012]](https://link.springer.com/content/pdf/10.1007%2F978-3-642-33765-9_11.pdf),[[数据]](http://printart.isr.ist.utl.pt/database.html),已被引用35次。
Painting-91 - 由4266张图像构成的数据集,发表在[[论文-2014]](https://link.springer.com/article/10.1007/s00138-014-0621-6),[[数据]](http://www.cat.uab.cat/~joost/painting91.html),累计引用次数达86次。
Rijksmusem - 包含3593幅画作及112039张图像的数据集,参见[[论文-2014]](https://dl.acm.org/doi/pdf/10.1145/2578726.2578791?download=true),[[数据]](https://figshare.com/articles/Rijksmuseum_Challenge_2014/5660617),[[代码]](https://github.com/tmensink/rijkschallenge),引用次数为60次。
Art 500K - 约计500,000张图像的数据集,相关论文见[[论文]](https://dl.acm.org/doi/pdf/10.1145/3123266.3123405?download=true),[[数据+代码]](http://deepart2.ece.ust.hk/ART500K/art500k.html),引用次数为22次。
SemArt - 由21,383张图像组成的集合,发表在[[论文-2018]](http://noagarciad.com/docs/VISART2018.pdf),[[数据]](http://noagarciad.com/SemArt/),引用11次。
omniart - 包含2,050,017张图像的数据集,可通过[[网站申请种子]](http://isis-data.science.uva.nl/strezoski/#3)获取,相关论文见[[论文]](https://dl.acm.org/doi/10.1145/3273022),引用次数为25次。
Web Gallery of Art - 约含19,000张图像的画廊艺术作品集。
Wikiart - 约含100,000张图像的艺术作品数据库,目前正在更新中,详情见[[网站]](https://www.wikiart.org/),[[python爬虫]](https://github.com/lucasdavid/wikiart),[[现成源1]](https://github.com/rkjones4/GANGogh),[[现成源 #2]](https://github.com/cs-chan/ArtGAN/tree/master/WikiArt%20Dataset)
Mulitask Painting Collection - 数据集详情见[[网站+下载]](http://www.ivl.disco.unimib.it/activities/paintings/),相关论文发表于[[论文-2019]](https://arxiv.org/pdf/1812.08052.pdf),引用次数为1次。
iMet Collection Dataset - 由375,000张图像构成的数据集,相关论文见[[论文]](https://arxiv.org/pdf/1906.00901.pdf),可在[[kaggle数据]](https://www.kaggle.com/c/imet-2019-fgvc6/overview)中获取。
创建时间:
2020-01-17
原始信息汇总
艺术数据集列表
科学数据集
-
PRINTART
- 图像数量: 988
- 引用次数: 35
- 数据链接: PRINTART数据库
-
Painting-91
- 图像数量: 4266
- 引用次数: 86
- 数据链接: Painting-91
-
Rijksmuseum
- 绘画数量: 3593
- 总图像数量: 112039
- 引用次数: 60
- 数据链接: Rijksmuseum Challenge 2014
- 代码链接: Rijksmuseum Challenge代码
-
Art 500K
- 图像数量: ~500,000
- 引用次数: 22
- 数据与代码链接: Art 500K
-
SemArt
- 图像数量: 21,383
- 引用次数: 11
- 数据链接: SemArt
-
omniart
- 图像数量: 2,050,017
- 引用次数: 25
- 网站链接: omniart申请下载
-
Web Gallery of Art
- 图像数量: ~19,000
- 网站链接: Web Gallery of Art
-
Wikiart
-
Mulitask Painting Collection
- 网站与下载链接: Mulitask Painting Collection
- 引用次数: 1
画廊收藏
-
MoMa Collection
- 内容: 仅艺术家数据
- GitHub链接: MoMa Collection
-
Paris Musées
- 图像数量: 150,221
- 网站链接: Paris Musées
-
iMet Collection Dataset
- 图像数量: 375,000
- Kaggle数据链接: iMet 2019 FGVC6
-
Carnegie Museum of Art Pittsburgh
- GitHub链接: Carnegie Museum of Art Pittsburgh
-
The Metropolitan Museum of Art
- GitHub链接: The Metropolitan Museum of Art
-
Nationalmuseum Sweden
- GitHub链接: Nationalmuseum Sweden
搜集汇总
数据集介绍

构建方式
PRINTART数据集构建于2012年,包含988幅图像,旨在为艺术图像分析提供基准数据。其数据来源主要为印刷艺术品,通过数字化处理生成高质量图像。Painting-91数据集则于2014年发布,包含4266幅绘画作品,涵盖了不同时期和风格的艺术家作品,数据通过公开资源收集并经过人工标注。Rijksmuseum数据集同样发布于2014年,包含3593幅绘画作品及112039张相关图像,数据来源于荷兰国立博物馆的开放资源,经过标准化处理和标注。
特点
PRINTART数据集以其高质量的印刷艺术品图像著称,适用于艺术风格识别和图像分类任务。Painting-91数据集则以其多样性和广泛的艺术风格覆盖为特点,适合用于跨风格的艺术研究。Rijksmuseum数据集以其大规模和高分辨率图像为优势,尤其适合深度学习模型的训练和评估。这些数据集均提供了详细的元数据,如艺术家信息、创作年代和艺术风格,为艺术研究提供了丰富的上下文信息。
使用方法
PRINTART数据集可通过其官方网站下载,适用于艺术风格分类和图像分析任务。Painting-91数据集同样提供公开下载链接,用户可直接获取图像和标注信息,适用于艺术风格迁移和图像生成研究。Rijksmuseum数据集可通过Figshare平台获取,其配套代码和挑战赛数据为研究者提供了便捷的实验环境。这些数据集的使用通常需要结合深度学习框架,如TensorFlow或PyTorch,以实现艺术图像的分类、风格迁移和生成等任务。
背景与挑战
背景概述
艺术数据集在机器学习和计算机视觉领域扮演着至关重要的角色,尤其是在图像分类、风格识别和艺术史研究等方面。PRINTART、Painting-91、Rijksmuseum、Wikiart等数据集自2012年起陆续发布,涵盖了从数百到数百万幅艺术作品的图像数据。这些数据集由多个研究机构和学者共同创建,如PRINTART由葡萄牙里斯本大学的研究团队开发,Rijksmuseum数据集则与阿姆斯特丹国家博物馆合作构建。这些数据集的核心研究问题包括艺术作品的自动分类、风格迁移、艺术家识别等,极大地推动了艺术与技术的交叉研究,并在学术界和工业界产生了广泛影响。
当前挑战
艺术数据集的构建与应用面临多重挑战。首先,艺术作品的多样性和复杂性使得自动分类和风格识别任务尤为困难,尤其是面对不同历史时期、文化背景和艺术流派的差异。其次,数据集的构建过程中,获取高质量、高分辨率的艺术作品图像并确保其版权合法性是一项艰巨的任务。此外,艺术作品的标注需要深厚的艺术史知识,人工标注的成本较高,且容易引入主观偏差。最后,尽管数据集规模不断扩大,但如何有效利用这些数据进行深度学习模型的训练,尤其是在跨文化和跨风格的任务中,仍然是一个亟待解决的问题。
常用场景
经典使用场景
在艺术与机器学习的交叉领域,PRINTART、Painting-91等数据集被广泛应用于艺术风格分类、艺术家识别以及图像生成等任务。这些数据集通过提供大量标注的艺术作品图像,为研究者提供了丰富的实验素材,推动了计算机视觉技术在艺术分析中的应用。
实际应用
在实际应用中,这些数据集被用于开发智能艺术推荐系统、虚拟博物馆导览以及艺术教育工具。例如,基于Wikiart数据集的艺术风格分类模型可以为用户推荐与其审美偏好相符的作品,而Rijksmuseum数据集则被用于构建虚拟展览,提升公众对艺术文化的参与度。
衍生相关工作
这些数据集催生了一系列经典研究工作,如基于SemArt的艺术语义分析、基于Art 500K的大规模艺术图像生成以及基于omniart的多模态艺术理解。这些研究不仅推动了艺术与技术的深度融合,还为跨学科研究提供了新的视角和方法。
以上内容由遇见数据集搜集并总结生成



