five

huggan/wikiart

收藏
Hugging Face2023-03-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/huggan/wikiart
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含来自WikiArt.org的81,444件视觉艺术作品,每件作品都有艺术家、流派和风格的标签。艺术家标签包含129个类别,其中包括一个“未知艺术家”类别;流派标签包含11个类别,其中包括一个“未知流派”类别;风格标签包含27个类别。数据集的结构包括图像、艺术家、流派和风格四个部分。数据集仅可用于非商业研究目的,使用该数据集需遵守WikiArt.org的条款和条件。

This dataset contains 81,444 visual artworks retrieved from WikiArt.org. Each artwork is labeled with three tags: artist, genre, and style. The artist tag has 129 categories, including an "Unknown Artist" category; the genre tag has 11 categories, including an "Unknown Genre" category; the style tag has 27 categories. The dataset is structured into four components: image data, artist annotations, genre annotations, and style annotations. This dataset is only available for non-commercial research purposes, and users must comply with the terms and conditions of WikiArt.org when using this dataset.
提供机构:
huggan
原始信息汇总

数据集概述

数据集基本信息

  • 许可证: 未知
  • 数据文件版权: 原作者所有
  • 大小: 10K<n<100K
  • 任务类别:
    • 图像分类
    • 文本到图像
    • 图像到文本
  • 标签: 艺术

数据集详情

  • 包含内容: 81,444件来自WikiArt.org的视觉艺术作品,每件作品附有类别标签。
  • 类别标签:
    • 艺术家: 129个艺术家类别,包括一个“未知艺术家”类别
    • 流派: 11个流派类别,包括一个“未知流派”类别
    • 风格: 27个风格类别

数据集结构

  • 数据字段:
    • 图像: 图像文件
    • 艺术家: 129个艺术家类别,包括一个“未知艺术家”类别
    • 流派: 11个流派类别,包括一个“未知流派”类别
    • 风格: 27个风格类别

数据来源

使用限制

  • 使用目的: 仅限非商业研究用途
  • 版权声明: 图像来自WikiArt.org,作者不对图像内容或意义负责
  • 使用协议: 使用本数据集需遵守WikiArt.org的条款和条件
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建基于对WikiArt.org网站的艺术作品进行抓取与分类,共包含81,444件来自不同艺术家的视觉艺术作品。数据集的构建采用了对艺术作品的艺术家、流派和风格进行分类的体系,涵盖了129个艺术家类别、11个流派类别以及27个风格类别,其中均包含未知类别。这些数据来源于一个经过精心策划的存档文件,确保了数据的多样性与可用性。
特点
数据集的特点在于其包含了丰富的视觉艺术资源,涵盖了从17世纪欧洲文化中发展起来的古典流派体系,直至当代艺术中的抽象与具象定义。它不仅展现了不同艺术家的作品,而且提供了关于作品流派和风格的多维度信息,这对于艺术领域的研究和图像分类任务尤为珍贵。数据集的使用受到非商业研究的限制,强调了内容的合法性与规范性。
使用方法
使用该数据集时,用户需遵守WikiArt.org的使用条款,仅限于非商业性研究。数据集的获取需通过指定的存档文件下载,用户可以依据图像的艺术家、流派和风格等标签进行分类研究或模型训练。数据集的结构化设计使得其在图像分类、文本到图像以及图像到文本等任务中具有良好的适用性,为相关领域的研究提供了有力的数据支撑。
背景与挑战
背景概述
在艺术研究领域,huggan/wikiart数据集承载着丰富的视觉艺术资料,该数据集源自WikiArt.org网站,由81,444件不同艺术家的作品构成,涵盖了艺术分类、流派和风格等多个维度。其创建旨在为艺术史的学术研究提供实证资源,自推出以来,该数据集已成为艺术信息学和计算机视觉领域的重要研究工具,对艺术作品的数字化分类与理解产生了深远影响。该数据集的构建工作始于非商业性研究目的,并由贡献者gigant在HuggingFace平台上进行整合与分享。
当前挑战
尽管huggan/wikiart数据集为艺术领域的研究提供了宝贵的资源,但在实际应用中仍面临诸多挑战。首先,数据集的版权信息不明确,这给数据的合法使用带来了困扰。其次,数据集中艺术作品的分类和标注存在一定的不准确性,例如‘Unknown Artist’和‘Unknown Genre’类的存在可能会影响研究的精确性。此外,如何在保持数据集完整性的同时,处理和优化图像质量,以满足不同研究需求,也是当前面临的重要挑战。
常用场景
经典使用场景
在艺术研究领域,huggan/wikiart数据集以其丰富的视觉艺术作品资源,成为图像分类任务中的一个经典应用场景。该数据集包含81,444件来自不同艺术家的视觉艺术作品,每件作品都标注有艺术家、流派和风格等信息,为研究者提供了宝贵的艺术分类研究基础。
解决学术问题
该数据集有效地解决了艺术分类研究中样本不足和标注不一致的问题,为学术研究提供了标准化和多样化的数据支持。通过该数据集,学者们能够更深入地探索艺术作品的流派和风格分类,促进了艺术史和艺术理论的发展。
衍生相关工作
基于huggan/wikiart数据集,研究者们开展了一系列相关工作,如艺术作品的情感分析、风格迁移和艺术市场价值评估等。这些衍生工作不仅拓宽了艺术研究的领域,也为艺术产业的数字化提供了新的视角和技术支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作