asahi417/wikiart-all
收藏Hugging Face2024-03-30 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/asahi417/wikiart-all
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: image
dtype: image
- name: id
dtype: string
- name: title
dtype: string
- name: url
dtype: string
- name: artistUrl
dtype: string
- name: artistName
dtype: string
- name: artistId
dtype: string
- name: completitionYear
dtype: int64
- name: dictionaries
sequence: string
- name: location
dtype: string
- name: period
struct:
- name: id
dtype: string
- name: title
dtype: string
- name: serie
struct:
- name: id
dtype: string
- name: title
dtype: string
- name: genres
sequence: string
- name: styles
sequence: string
- name: media
sequence: string
- name: sizeX
dtype: float64
- name: sizeY
dtype: float64
- name: diameter
dtype: float64
- name: galleries
sequence: string
- name: tags
sequence: string
- name: description
dtype: string
- name: width
dtype: int64
- name: height
dtype: int64
- name: group
dtype: string
splits:
- name: test
num_bytes: 4300047463.370933
num_examples: 63061
download_size: 4289871770
dataset_size: 4300047463.370933
configs:
- config_name: default
data_files:
- split: test
path: data/test-*
---
# WikiART Image Datasets
WikiART image dataset is a collection of paintings extracted from [WikiART](https://www.wikiart.org/).
<p align="center">
<img src="assets/wikiart_general.png" width="650"><br>
</p>
The dataset contains following meta attributes from WikiART entry:
- 'image', 'id', 'title', 'url', 'artistUrl', 'artistName', 'artistId', 'completitionYear', 'dictionaries', 'location', 'period', 'serie', 'genres', 'styles', 'media', 'sizeX', 'sizeY', 'diameter', 'galleries', 'tags', 'description', 'width', 'height', 'group'
***Statistics per Art Movement***
An art movement is assigned to each image.
| Art Movement | Num of Images |
|:--------------|------:|
| baroque | 5483 |
| expressionism | 6369 |
| impressionism | 9895 |
| neoclassicism | 14 |
| realism | 12460 |
| rococo | 3262 |
| romanticism | 12993 |
| surrealism | 4922 |
| symbolism | 7663 |
| All | 63061 |
***Statistics per Art Genre***
An image can have multiple genres.
| Art Genre | Num of Images |
|:----------------------|------:|
| abstract | 809 |
| advertisement | 15 |
| allegorical painting | 553 |
| animal painting | 1111 |
| animation | 2 |
| architecture | 3 |
| battle painting | 364 |
| calligraphy | 3 |
| capriccio | 74 |
| caricature | 374 |
| cityscape | 3495 |
| cloudscape | 373 |
| design | 568 |
| figurative | 1015 |
| flower painting | 778 |
| furniture | 3 |
| genre painting | 10608 |
| history painting | 819 |
| icon | 15 |
| illustration | 1372 |
| installation | 43 |
| interior | 507 |
| landscape | 11628 |
| literary painting | 513 |
| marina | 1772 |
| miniature | 1 |
| mosaic | 2 |
| mythological painting | 1354 |
| nude painting (nu) | 1449 |
| panorama | 11 |
| pastorale | 82 |
| photo | 261 |
| portrait | 13604 |
| poster | 79 |
| quadratura | 16 |
| religious painting | 3087 |
| sculpture | 657 |
| self-portrait | 846 |
| sketch and study | 2452 |
| still life | 1224 |
| symbolic painting | 1503 |
| tapestry | 3 |
| tessellation | 121 |
| trompe-l'œil | 19 |
| tronie | 147 |
| utensil | 4 |
| vanitas | 17 |
| veduta | 165 |
| wildlife painting | 203 |
数据集信息:
特征:
- 名称:图像(image),数据类型:图像
- 名称:编号(id),数据类型:字符串(string)
- 名称:作品标题(title),数据类型:字符串
- 名称:作品链接(url),数据类型:字符串
- 名称:艺术家链接(artistUrl),数据类型:字符串
- 名称:艺术家姓名(artistName),数据类型:字符串
- 名称:艺术家编号(artistId),数据类型:字符串
- 名称:创作年份(completitionYear),数据类型:64位整数(int64)
- 名称:词典列表(dictionaries),数据类型:字符串序列
- 名称:馆藏地点(location),数据类型:字符串
- 名称:创作时期(period),结构体包含:
- 名称:编号(id),数据类型:字符串
- 名称:标题(title),数据类型:字符串
- 名称:作品系列(serie),结构体包含:
- 名称:编号(id),数据类型:字符串
- 名称:标题(title),数据类型:字符串
- 名称:艺术体裁列表(genres),数据类型:字符串序列
- 名称:艺术风格列表(styles),数据类型:字符串序列
- 名称:创作媒介列表(media),数据类型:字符串序列
- 名称:横轴尺寸(sizeX),数据类型:64位浮点数(float64)
- 名称:纵轴尺寸(sizeY),数据类型:64位浮点数(float64)
- 名称:直径(diameter),数据类型:64位浮点数(float64)
- 名称:画廊列表(galleries),数据类型:字符串序列
- 名称:标签列表(tags),数据类型:字符串序列
- 名称:作品描述(description),数据类型:字符串
- 名称:宽度(width),数据类型:64位整数(int64)
- 名称:高度(height),数据类型:64位整数(int64)
- 名称:分组(group),数据类型:字符串
划分集:
- 名称:测试集(test),字节数:4300047463.370933,样本数量:63061
下载大小:4289871770,数据集总大小:4300047463.370933
配置项:
- 配置名称:默认(default),数据文件:
- 划分:测试集,路径:data/test-*
---
# 维基艺术图像数据集(WikiART Image Dataset)
维基艺术图像数据集是从[维基艺术官网(WikiART)](https://www.wikiart.org/)提取的绘画作品集合。
<p align="center">
<img src="assets/wikiart_general.png" width="650"><br>
</p>
该数据集包含来自WikiART条目的以下元数据属性:
- 'image', 'id', 'title', 'url', 'artistUrl', 'artistName', 'artistId', 'completitionYear', 'dictionaries', 'location', 'period', 'serie', 'genres', 'styles', 'media', 'sizeX', 'sizeY', 'diameter', 'galleries', 'tags', 'description', 'width', 'height', 'group'
***按艺术流派(art movement)统计***
每张图像均对应一个艺术流派。
| 艺术流派 | 图像数量 |
|:--------------|------:|
| 巴洛克(Baroque) | 5483 |
| 表现主义(Expressionism) | 6369 |
| 印象主义(Impressionism) | 9895 |
| 新古典主义(Neoclassicism) | 14 |
| 现实主义(Realism) | 12460 |
| 洛可可(Rococo) | 3262 |
| 浪漫主义(Romanticism) | 12993 |
| 超现实主义(Surrealism) | 4922 |
| 象征主义(Symbolism) | 7663 |
| 总计(All) | 63061 |
***按艺术体裁(art genre)统计***
单张图像可对应多个艺术体裁。
| 艺术体裁 | 图像数量 |
|:----------------------|------:|
| 抽象艺术(abstract) | 809 |
| 广告画(advertisement) | 15 |
| 寓意画(allegorical painting) | 553 |
| 动物画(animal painting) | 1111 |
| 动画(animation) | 2 |
| 建筑作品(architecture) | 3 |
| 战争画(battle painting) | 364 |
| 书法(calligraphy) | 3 |
| 幻想画(capriccio) | 74 |
| 漫画(caricature) | 374 |
| 城市风景画(cityscape) | 3495 |
| 云景画(cloudscape) | 373 |
| 设计作品(design) | 568 |
| 具象艺术(figurative) | 1015 |
| 花卉画(flower painting) | 778 |
| 家具作品(furniture) | 3 |
| 风俗画(genre painting) | 10608 |
| 历史画(history painting) | 819 |
| 圣像画(icon) | 15 |
| 插画(illustration) | 1372 |
| 装置艺术(installation) | 43 |
| 室内画(interior) | 507 |
| 风景画(landscape) | 11628 |
| 文学题材画(literary painting) | 513 |
| 海景画(marina) | 1772 |
| 微型画(miniature) | 1 |
| 马赛克镶嵌画(mosaic) | 2 |
| 神话题材画(mythological painting) | 1354 |
| 裸体画(nude painting (nu)) | 1449 |
| 全景画(panorama) | 11 |
| 田园画(pastorale) | 82 |
| 摄影作品(photo) | 261 |
| 肖像画(portrait) | 13604 |
| 海报(poster) | 79 |
| 透视装饰画(quadratura) | 16 |
| 宗教画(religious painting) | 3087 |
| 雕塑(sculpture) | 657 |
| 自画像(self-portrait) | 846 |
| 素描与习作(sketch and study) | 2452 |
| 静物画(still life) | 1224 |
| 象征主义绘画(symbolic painting) | 1503 |
| 挂毯作品(tapestry) | 3 |
| 镶嵌画(tessellation) | 121 |
| 错视画(trompe-l'œil) | 19 |
| 特罗尼画(tronie) | 147 |
| 日用器物画(utensil) | 4 |
| 虚空画(vanitas) | 17 |
| 景观画(veduta) | 165 |
| 野生动物画(wildlife painting) | 203 |
提供机构:
asahi417
原始信息汇总
数据集概述
数据集名称
WikiART Image Datasets
数据集特征
- image: 图片数据
- id: 字符串
- title: 字符串
- url: 字符串
- artistUrl: 字符串
- artistName: 字符串
- artistId: 字符串
- completitionYear: 整数
- dictionaries: 字符串序列
- location: 字符串
- period: 结构体,包含
id(字符串)和title(字符串) - serie: 结构体,包含
id(字符串)和title(字符串) - genres: 字符串序列
- styles: 字符串序列
- media: 字符串序列
- sizeX: 浮点数
- sizeY: 浮点数
- diameter: 浮点数
- galleries: 字符串序列
- tags: 字符串序列
- description: 字符串
- width: 整数
- height: 整数
- group: 字符串
数据集分割
- test: 包含 63061 个样本,数据集大小为 4300047463.370933 字节,下载大小为 4289871770 字节。
统计信息
- 艺术运动统计: 包含多种艺术运动,总计 63061 张图片。
- 艺术流派统计: 每张图片可能属于多个艺术流派,总计包含多种流派。
搜集汇总
数据集介绍

构建方式
在艺术数字化浪潮中,WikiART图像数据集通过系统化采集WikiART在线艺术平台的公开资源构建而成。该数据集整合了超过六万三千幅绘画作品,每幅作品均附带详尽的元数据属性,涵盖图像本身、作品标题、艺术家信息、创作年份、艺术运动、流派风格、媒介材料以及物理尺寸等多维度描述性字段。构建过程注重数据的结构化与标准化,确保了艺术史信息的完整性与可追溯性,为计算艺术学研究提供了坚实的数据基础。
特点
该数据集的核心特征在于其丰富的多标签标注体系与精细的艺术史分类。每幅画作不仅关联了单一的艺术运动,如巴洛克、印象派或浪漫主义,还同时标注了可能涉及的多种艺术体裁,例如肖像画、风景画或静物画。这种多层次、细粒度的标注结构,使得数据集能够支持复杂的跨类别分析与风格迁移研究。其元数据的全面性,包括创作地点、所属系列、馆藏信息乃至作品描述,为深入理解艺术作品的语境与内涵提供了关键线索。
使用方法
在艺术与人工智能的交叉领域,该数据集主要服务于视觉风格分析、生成模型训练以及艺术史计算研究。研究者可通过加载数据集,直接访问图像及其对应的结构化元数据,进而进行基于内容的图像检索、艺术流派分类模型的训练与评估,或作为文本到图像生成模型的优质训练素材。其标准化的数据格式便于集成至主流机器学习框架,支持从简单的特征提取到复杂的多模态学习等一系列下游任务。
背景与挑战
背景概述
在数字人文与计算机视觉交叉领域,艺术图像数据集对于推动风格分析、生成与理解研究具有关键价值。asahi417/wikiart-all数据集由研究人员asahi417基于WikiART在线艺术百科全书构建,收录了涵盖巴洛克、浪漫主义、印象派等九大艺术运动与数十种艺术流派的六万余幅绘画作品。该数据集不仅提供了高分辨率图像,还整合了创作年代、艺术家信息、作品尺寸、题材风格等丰富的元数据,为艺术史量化研究与生成式人工智能在艺术领域的应用奠定了数据基础。其结构化标注体系支持多维度分析,显著促进了艺术风格迁移、分类与检索等任务的发展。
当前挑战
该数据集致力于解决艺术图像多标签分类与跨时代风格识别的核心挑战,其难点在于艺术流派与题材往往存在重叠与主观界定,例如一幅作品可能同时属于肖像画与象征主义,要求模型具备细粒度特征解耦能力。在构建过程中,挑战主要源于原始WikiART数据的异构性与完整性:元数据字段存在缺失或非标准化表述,如“完成年份”可能包含估计值或范围;艺术运动与流派的标注依赖人工策展,可能引入主观偏差;此外,图像质量、尺寸不一以及版权限制下的数据采集,亦增加了数据集清洗与归一化的复杂度。
常用场景
经典使用场景
在艺术史与计算机视觉的交叉领域,WikiART图像数据集为风格迁移与艺术分类研究提供了丰富的素材。该数据集汇集了从巴洛克到超现实主义等九大艺术运动的六万余幅画作,每幅作品均标注了详细的元数据,如艺术流派、风格、创作年代及艺术家信息。研究者可借此构建深度学习模型,自动识别画作的风格特征或完成跨艺术时期的图像生成任务,从而探索视觉艺术中的模式演变与创造性表达。
解决学术问题
该数据集有效应对了艺术分析中大规模标注数据稀缺的挑战,为量化艺术风格提供了结构化基础。通过整合多维属性,它支持研究者深入探究艺术风格与历史、文化背景的关联,例如分析不同艺术运动在构图、色彩与主题上的统计学差异。这不仅推动了计算艺术学的发展,也为文化遗产的数字化保存与跨学科研究搭建了桥梁,深化了人类对视觉艺术演变规律的理解。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作,尤其在艺术风格分类与生成领域。例如,有研究利用其训练卷积神经网络,实现了对艺术运动的高精度自动识别;另有工作结合生成对抗网络,开发了能够模仿特定画家笔触的风格迁移算法。这些成果不仅验证了数据集的实用价值,也进一步激发了关于艺术创造力与人工智能融合的学术讨论。
以上内容由遇见数据集搜集并总结生成



