five

wikiart|艺术分类数据集|图像识别数据集

收藏
huggingface2024-08-25 更新2024-12-12 收录
艺术分类
图像识别
下载链接:
https://huggingface.co/datasets/nroggendorff/wikiart
下载链接
链接失效反馈
资源简介:
该数据集主要用于艺术作品的分类和识别任务,包含了2000幅艺术作品的图像数据,每个图像关联了艺术家、流派、风格和文本信息。艺术家标签涵盖了129位不同艺术家,流派标签涵盖了11种艺术流派,风格标签涵盖了27种艺术风格。
创建时间:
2024-08-25
原始信息汇总

WikiArt 数据集概述

数据集信息

特征

  • 图像 (image): 数据类型为图像。
  • 艺术家 (artist): 数据类型为类别标签,包含以下艺术家:
    • 0: Unknown Artist
    • 1: boris-kustodiev
    • 2: camille-pissarro
    • 3: childe-hassam
    • 4: claude-monet
    • 5: edgar-degas
    • 6: eugene-boudin
    • 7: gustave-dore
    • 8: ilya-repin
    • 9: ivan-aivazovsky
    • 10: ivan-shishkin
    • 11: john-singer-sargent
    • 12: marc-chagall
    • 13: martiros-saryan
    • 14: nicholas-roerich
    • 15: pablo-picasso
    • 16: paul-cezanne
    • 17: pierre-auguste-renoir
    • 18: pyotr-konchalovsky
    • 19: raphael-kirchner
    • 20: rembrandt
    • 21: salvador-dali
    • 22: vincent-van-gogh
    • 23: hieronymus-bosch
    • 24: leonardo-da-vinci
    • 25: albrecht-durer
    • 26: edouard-cortes
    • 27: sam-francis
    • 28: juan-gris
    • 29: lucas-cranach-the-elder
    • 30: paul-gauguin
    • 31: konstantin-makovsky
    • 32: egon-schiele
    • 33: thomas-eakins
    • 34: gustave-moreau
    • 35: francisco-goya
    • 36: edvard-munch
    • 37: henri-matisse
    • 38: fra-angelico
    • 39: maxime-maufra
    • 40: jan-matejko
    • 41: mstislav-dobuzhinsky
    • 42: alfred-sisley
    • 43: mary-cassatt
    • 44: gustave-loiseau
    • 45: fernando-botero
    • 46: zinaida-serebriakova
    • 47: georges-seurat
    • 48: isaac-levitan
    • 49: joaquã­n-sorolla
    • 50: jacek-malczewski
    • 51: berthe-morisot
    • 52: andy-warhol
    • 53: arkhip-kuindzhi
    • 54: niko-pirosmani
    • 55: james-tissot
    • 56: vasily-polenov
    • 57: valentin-serov
    • 58: pietro-perugino
    • 59: pierre-bonnard
    • 60: ferdinand-hodler
    • 61: bartolome-esteban-murillo
    • 62: giovanni-boldini
    • 63: henri-martin
    • 64: gustav-klimt
    • 65: vasily-perov
    • 66: odilon-redon
    • 67: tintoretto
    • 68: gene-davis
    • 69: raphael
    • 70: john-henry-twachtman
    • 71: henri-de-toulouse-lautrec
    • 72: antoine-blanchard
    • 73: david-burliuk
    • 74: camille-corot
    • 75: konstantin-korovin
    • 76: ivan-bilibin
    • 77: titian
    • 78: maurice-prendergast
    • 79: edouard-manet
    • 80: peter-paul-rubens
    • 81: aubrey-beardsley
    • 82: paolo-veronese
    • 83: joshua-reynolds
    • 84: kuzma-petrov-vodkin
    • 85: gustave-caillebotte
    • 86: lucian-freud
    • 87: michelangelo
    • 88: dante-gabriel-rossetti
    • 89: felix-vallotton
    • 90: nikolay-bogdanov-belsky
    • 91: georges-braque
    • 92: vasily-surikov
    • 93: fernand-leger
    • 94: konstantin-somov
    • 95: katsushika-hokusai
    • 96: sir-lawrence-alma-tadema
    • 97: vasily-vereshchagin
    • 98: ernst-ludwig-kirchner
    • 99: mikhail-vrubel
    • 100: orest-kiprensky
    • 101: william-merritt-chase
    • 102: aleksey-savrasov
    • 103: hans-memling
    • 104: amedeo-modigliani
    • 105: ivan-kramskoy
    • 106: utagawa-kuniyoshi
    • 107: gustave-courbet
    • 108: william-turner
    • 109: theo-van-rysselberghe
    • 110: joseph-wright
    • 111: edward-burne-jones
    • 112: koloman-moser
    • 113: viktor-vasnetsov
    • 114: anthony-van-dyck
    • 115: raoul-dufy
    • 116: frans-hals
    • 117: hans-holbein-the-younger
    • 118: ilya-mashkov
    • 119: henri-fantin-latour
    • 120: m.c.-escher
    • 121: el-greco
    • 122: mikalojus-ciurlionis
    • 123: james-mcneill-whistler
    • 124: karl-bryullov
    • 125: jacob-jordaens
    • 126: thomas-gainsborough
    • 127: eugene-delacroix
    • 128: canaletto
  • 流派 (genre): 数据类型为类别标签,包含以下流派:
    • 0: abstract_painting
    • 1: cityscape
    • 2: genre_painting
    • 3: illustration
    • 4: landscape
    • 5: nude_painting
    • 6: portrait
    • 7: religious_painting
    • 8: sketch_and_study
    • 9: still_life
    • 10: Unknown Genre
  • 风格 (style): 数据类型为类别标签,包含以下风格:
    • 0: Abstract_Expressionism
    • 1: Action_painting
    • 2: Analytical_Cubism
    • 3: Art_Nouveau
    • 4: Baroque
    • 5: Color_Field_Painting
    • 6: Contemporary_Realism
    • 7: Cubism
    • 8: Early_Renaissance
    • 9: Expressionism
    • 10: Fauvism
    • 11: High_Renaissance
    • 12: Impressionism
    • 13: Mannerism_Late_Renaissance
    • 14: Minimalism
    • 15: Naive_Art_Primitivism
    • 16: New_Realism
    • 17: Northern_Renaissance
    • 18: Pointillism
    • 19: Pop_Art
    • 20: Post_Impressionism
    • 21: Realism
    • 22: Rococo
    • 23: Romanticism
    • 24: Symbolism
    • 25: Synthetic_Cubism
    • 26: Ukiyo_e
  • 文本 (text): 数据类型为字符串。

数据分割

  • 训练集 (train): 包含 2000 个样本,总字节数为 918998490.0。

数据集大小

  • 下载大小: 918865304 字节
  • 数据集大小: 918998490.0 字节

配置

  • 配置名称: default
  • 数据文件:
    • 分割: train
    • 路径: data/train-*
AI搜集汇总
数据集介绍
main_image_url
构建方式
WikiArt数据集通过从WikiArt艺术平台上收集大量艺术作品图像及其元数据构建而成。每幅作品均附有艺术家、流派、风格等标签信息,确保了数据的多样性和丰富性。数据集的构建过程严格遵循艺术史的分类标准,涵盖了从文艺复兴到现代艺术的广泛时期和风格,确保了其学术价值和实用性。
特点
WikiArt数据集的特点在于其广泛的覆盖范围和精细的标注。数据集包含了超过80,000幅艺术作品,涵盖了从抽象表现主义到写实主义的多种艺术风格。每幅作品均标注了艺术家、流派和风格信息,使得该数据集在艺术风格识别、艺术家分类等任务中具有极高的应用价值。此外,数据集的多样性还体现在其包含了不同时期、不同文化背景的艺术作品,为跨文化研究提供了丰富的素材。
使用方法
WikiArt数据集可用于多种艺术相关的研究任务,如艺术风格分类、艺术家识别、艺术流派分析等。研究人员可以通过加载数据集中的图像和标签信息,利用深度学习模型进行训练和测试。数据集的结构清晰,支持直接通过HuggingFace平台进行访问和下载,便于快速集成到现有的研究框架中。此外,数据集的丰富标注信息也为多任务学习提供了可能,使得研究者能够在同一数据集上进行多种任务的探索。
背景与挑战
背景概述
WikiArt数据集是一个专注于艺术领域的图像数据集,涵盖了从文艺复兴到现代艺术的广泛时期和风格。该数据集由WikiArt平台创建,旨在为艺术史研究、计算机视觉和机器学习领域提供丰富的视觉资源。数据集包含了超过80,000幅艺术作品,每幅作品都标注了艺术家、流派和风格等信息。这些信息不仅为艺术史学者提供了宝贵的研究材料,也为计算机视觉领域的图像分类、风格迁移等任务提供了高质量的训练数据。WikiArt数据集的创建标志着艺术与技术的深度融合,推动了艺术研究方法的革新。
当前挑战
WikiArt数据集在解决艺术图像分类和风格识别等问题时面临诸多挑战。首先,艺术作品的风格和流派具有高度的主观性和多样性,不同学者对同一作品的分类可能存在分歧,这为数据标注带来了困难。其次,艺术作品的图像质量参差不齐,部分作品因年代久远或保存不当而存在模糊、褪色等问题,影响了计算机视觉算法的性能。此外,数据集的构建过程中还面临着版权和隐私问题,部分艺术作品的版权归属复杂,获取合法授权成为一大难题。这些挑战不仅影响了数据集的完整性,也对相关领域的研究提出了更高的要求。
常用场景
经典使用场景
WikiArt数据集在艺术风格识别和艺术家分类研究中扮演着重要角色。该数据集包含了大量艺术作品的图像及其对应的艺术家、风格和流派信息,为研究人员提供了一个丰富的资源库,用于训练和验证深度学习模型在艺术领域的应用。通过分析这些数据,研究者能够深入探讨不同艺术风格之间的差异与联系,进而推动艺术风格自动识别技术的发展。
实际应用
在实际应用中,WikiArt数据集被广泛用于艺术作品的自动分类和推荐系统。例如,博物馆和画廊可以利用该数据集训练模型,自动识别和分类馆藏作品,提升展览策划的效率。此外,艺术教育平台也可以借助该数据集开发智能推荐系统,根据用户的兴趣推荐相关艺术作品,增强学习体验。
衍生相关工作
基于WikiArt数据集,许多经典研究工作得以展开。例如,研究者开发了基于卷积神经网络的艺术风格分类模型,显著提升了分类精度。此外,该数据集还催生了多项关于艺术家风格演变的研究,揭示了不同艺术家在不同时期的创作特点。这些工作不仅丰富了艺术史的研究内容,也为艺术与人工智能的结合提供了新的思路。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

河湖“清四乱”监测

通过卫星遥感技术,对河流、湖泊、坑塘、水库等现状情况及变化趋势进行监测,对目标水域的水体富营养化、总磷、总氮等水质指标进行反演,对水利工程实施和建设进度进行跟踪监测,对河湖“四乱”行为进行监测排查,帮助用户快速掌握水域面积和水质变化情况、水利工程设施的建设进展情况以及追溯河湖“四乱”整治情况。

上海数据交易所登记层 收录

Fruits-360

一个高质量的水果图像数据集,包含多种水果的图像,如苹果、香蕉、樱桃等,总计42345张图片,分为训练集和验证集,共有64个水果类别。

github 收录

TT100K - Tsinghua-Tencent 100K

TT100K数据集是一个用于交通标志检测和识别的大规模数据集,包含100,000张标注的交通标志图像。该数据集主要用于计算机视觉和自动驾驶领域的研究。

cg.cs.tsinghua.edu.cn 收录