five

PainterPalette dataset

收藏
github2024-05-08 更新2024-05-31 收录
下载链接:
https://github.com/me9hanics/PainterPalette
下载链接
链接失效反馈
官方服务:
资源简介:
该项目旨在创建互联网上最丰富的画家公共数据集,数据来源包括WikiArt和Art500k,通过Wikipedia API补充缺失的画家数据并进行自动和手动修正。数据集包含约10000名画家及其多种属性,如国籍、艺术风格、活动地点等,并可用于数据分析、机器学习和可视化项目。

This project aims to create the most comprehensive public dataset of painters on the internet. The data sources include WikiArt and Art500k, with missing painter data supplemented via the Wikipedia API and subjected to both automated and manual corrections. The dataset encompasses approximately 10,000 painters along with various attributes such as nationality, artistic style, and locations of activity. It is suitable for data analysis, machine learning, and visualization projects.
创建时间:
2023-12-27
原始信息汇总

数据集概述

数据集名称: PainterPalette dataset

数据集目的: 创建一个包含约10000位画家的数据集,结合来自WikiArt和Art500k等来源的特征,通过Wikipedia API补充缺失数据,并进行自动和手动修正/添加。

数据集内容:

  • 生物数据: 国籍/公民身份、姓名、出生和死亡年份及地点、性别
  • 艺术风格数据
  • 活动地点(有时包括年份)
  • 职业(如画家、雕塑家、平版画家等)
  • 影响力: 对画家及来自画家的影响、学生、教师
  • 朋友、同事(数据有限)
  • 绘画数量,按风格等

数据集用途: 用于数据分析、机器学习、可视化项目等。

数据集文件: 最终数据集存储在artists.csv文件中。

数据集字段:

  • artist
  • Nationality
  • citizenship
  • gender
  • styles
  • movement
  • Art500k_Movements
  • birth_place
  • death_place
  • birth_year
  • death_year
  • FirstYear
  • LastYear
  • wikiart_pictures_count
  • locations
  • locations_with_years
  • styles_extended
  • StylesCount
  • StylesYears
  • occupations
  • PaintingsExhibitedAt
  • PaintingsExhibitedAtCount
  • PaintingSchool
  • Influencedby
  • Influencedon
  • Pupils
  • Teachers
  • FriendsandCoworkers
  • Contemporary
  • ArtMovement
  • Type

数据集示例:

| artist | Nationality | citizenship | gender | styles | movement | Art500k_Movements | birth_place | death_place | birth_year | death_year | FirstYear | LastYear | wikiart_pictures_count | locations | locations_with_years | styles_extended | StylesCount | StylesYears | occupations | PaintingsExhibitedAt | PaintingsExhibitedAtCount | PaintingSchool | Influencedby | Influencedon | Pupils | Teachers | FriendsandCoworkers | Contemporary | ArtMovement | Type | |---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---| | Bracha L. Ettinger | French,Jewish,Israeli | Israel | female | New European Painting | New European Painting | {New European Painting:21} | Tel Aviv | NaN | 1948 | NaN | 1991 | 2009 | 21 | [] | [] | {New European Painting:21} | {New European Painting:21} | New European Painting:1991-2009 | philosopher, psychoanalyst, painter, photographer | NaN | NaN | NaN | NaN | NaN | NaN | NaN | Yes | NaN | NaN | | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |

数据集进展:

  • 正在开发方法以在Art500k数据集中找到画家的别名(例如,Rembrandt和Rembrandt van Rijn)。
  • 正在扩展数据集的组合,处理别名,添加更多画家到最终数据集。

数据集可视化:

  • 时间-地点网络图
  • 运动网络图
  • 画家影响网络图

数据集使用示例:

  • 筛选文艺复兴时期的画家
  • 列出居住在巴黎的画家
  • 获取莫奈按风格分类的绘画数量

数据集许可证: MIT License

联系信息:

  • 对应作者: Mihaly Hanics (CEU Vienna, Austria)
  • 联系方式: hanicsm@gmail.com
搜集汇总
数据集介绍
main_image_url
构建方式
PainterPalette数据集通过整合来自WikiArt和Art500k等多个来源的数据构建而成。首先,从这些来源中提取画家的基本信息,并通过Wikipedia API填补缺失数据。随后,通过自动化和手动校正的方式对数据进行修正和补充,最终形成了包含约10000名画家的详细数据集。数据集的构建过程中,还通过映射不同来源中的画家信息,确保了数据的完整性和一致性。
特点
PainterPalette数据集具有丰富的属性,涵盖了画家的生平、艺术风格、活动地点、职业、影响力等多个方面。数据集包含29个属性,如国籍、性别、出生和死亡年份、艺术风格、活动地点等。此外,数据集还记录了画家之间的影响关系、师生关系以及同事关系,为研究画家之间的网络关系提供了基础。
使用方法
PainterPalette数据集可以通过多种方式使用,包括数据分析、机器学习和可视化项目。用户可以通过Python环境中的Pandas库直接导入数据集,使用简单的代码即可进行数据筛选和分析。例如,用户可以根据艺术风格筛选画家,或根据活动地点查找特定地区的画家。数据集还提供了CSV、SQL和Excel等多种格式的下载选项,方便用户在不同场景下使用。
背景与挑战
背景概述
PainterPalette数据集是由me9hanics团队创建的一个全面公开的画家数据集,旨在整合来自WikiArt和Art500k等来源的画家信息。该数据集包含了约10000名画家的详细信息,涵盖了29个属性,如国籍、性别、艺术风格、活动地点、职业、影响力等。通过自动化和手动校正,数据集填补了画家信息的缺失部分,并提供了丰富的数据分析和机器学习应用潜力。该数据集的创建不仅为艺术史研究提供了新的数据支持,还为艺术风格分析、画家网络构建等领域的研究提供了基础。
当前挑战
PainterPalette数据集在构建过程中面临多个挑战。首先,数据来源的多样性导致了数据格式和内容的不一致,需要进行复杂的映射和整合。其次,画家信息的缺失和不完整性要求通过自动化和手动校正相结合的方式进行补充和修正。此外,画家别名的处理也是一个重要挑战,尤其是当同一画家在不同数据集中以不同名称出现时。最后,数据集的扩展性和更新性也是一个持续的挑战,需要不断添加新的画家信息并保持数据的实时性。
常用场景
经典使用场景
PainterPalette数据集的经典使用场景主要集中在艺术史研究、艺术家网络分析以及艺术风格演变的研究中。通过该数据集,研究者可以分析不同艺术家的生平、创作风格、影响力及其在艺术史中的地位。例如,研究者可以利用数据集中的时间与地点信息,构建艺术家之间的社交网络,探讨艺术家之间的合作与影响关系。此外,该数据集还可用于机器学习任务,如艺术风格的分类与识别,帮助自动化分析大量艺术作品的风格特征。
解决学术问题
PainterPalette数据集解决了艺术史研究中长期存在的数据整合与分析难题。传统上,艺术家的生平、作品风格及影响力等信息分散在不同的文献和数据库中,难以系统化分析。该数据集通过整合WikiArt、Art500k等来源的数据,提供了丰富的艺术家属性,如国籍、出生地、艺术风格、创作时期等,极大地简化了艺术史研究的数据获取与处理过程。这不仅有助于学者深入研究艺术家的个体特征,还能推动艺术史领域的定量分析与跨学科研究。
衍生相关工作
PainterPalette数据集的发布催生了一系列相关的经典工作。例如,基于该数据集,研究者构建了艺术家之间的合作与影响网络,分析了不同艺术风格之间的演变关系。此外,还有研究利用该数据集进行艺术风格的分类与识别,开发了自动化的艺术风格分析工具。这些工作不仅丰富了艺术史研究的工具箱,还为机器学习在艺术领域的应用提供了新的思路。未来,随着数据集的不断完善,预计将有更多基于该数据集的创新研究涌现。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作