five

MoMA_dataset|艺术数据数据集|博物馆分析数据集

收藏
github2019-10-15 更新2024-05-31 收录
艺术数据
博物馆分析
下载链接:
https://github.com/victorBigand/MoMA_dataset
下载链接
链接失效反馈
资源简介:
这两个CSV文件包含关于MoMA艺术品及其对应艺术家的数据。它们是原始数据集的简化版和清洁版,原始数据集可在此处找到:https://github.com/MuseumofModernArt/collection。第一个数据集名为artworks,包含44,193行,具有标题、年份和ConstituentID三个属性。第二个数据集名为artists,包含15,000行,具有ConstituentID、DisplayName、Nationality和Gender四个属性。

这两个CSV文件存储了关于现代艺术博物馆(MoMA)藏品及其创作者的相关信息。它们是对原始数据集的精简与净化版本,原始数据集可通过以下链接获取:https://github.com/MuseumofModernArt/collection。其中,名为'artworks'的数据集包含44,193条记录,并包含标题、创作年份以及构成者ID(ConstituentID)三个属性。而名为'artists'的数据集则包含15,000条记录,并包含构成者ID(ConstituentID)、显示名称(DisplayName)、国籍(Nationality)以及性别(Gender)四个属性。
创建时间:
2019-10-15
原始信息汇总

MoMA_dataset 概述

数据集组成

本数据集包含两个CSV文件:

  1. artworks

    • 行数:44,193
    • 属性:
      • Title(标题)
      • Year(年份)
      • ConstituentID(成分ID)
  2. artists

    • 行数:15,000
    • 属性:
      • ConstituentID(成分ID)
      • DisplayName(显示名称)
      • Nationality(国籍)
      • Gender(性别)

数据来源

数据集是基于原始数据集的简化版,原始数据集可在此处获取:https://github.com/MuseumofModernArt/collection

AI搜集汇总
数据集介绍
main_image_url
构建方式
MoMA_dataset的构建,是通过整理现代艺术博物馆(MoMA)的艺术作品及其对应艺术家信息而形成。该数据集由两个CSV文件组成,分别记录了艺术作品与艺术家的相关属性,是对原始数据集的简化和清洗版本,旨在为研究者和爱好者提供清晰、可用之数据资源。
特点
本数据集具有以下显著特点:涵盖了44,193件艺术作品的基本信息,以及15,000名艺术家的身份与背景资料。艺术作品信息包含标题、年份和唯一标识符(ConstituentID),而艺术家信息则包括姓名、国籍和性别,为研究现代艺术及其发展提供了宝贵的数据基础。
使用方法
使用MoMA_dataset数据集时,用户可以直接访问CSV文件,并根据需求提取艺术作品或艺术家的相关信息。此外,数据集中的唯一标识符(ConstituentID)可以作为连接艺术作品与艺术家信息的桥梁,便于构建更加复杂的数据分析模型。
背景与挑战
背景概述
MoMA_dataset是关于纽约现代艺术博物馆(MoMA)藏品的数据集,其旨在为艺术史研究、艺术作品展示及艺术家分析提供数据支持。该数据集由MoMA官方提供,并经过简化与清洗处理,以便研究者更便捷地使用。其创建时间未明确标注,但根据MoMA的藏品更新频率,数据集应保持一定的时效性。主要研究人员或机构为Museum of Modern Art,该数据集为艺术领域尤其是现代艺术研究提供了宝贵的资源,对于推动艺术数据的量化分析具有重要的学术影响力。
当前挑战
在研究领域,MoMA_dataset面临的挑战主要包括:如何准确地将艺术作品的风格、流派和技法等信息进行分类与标注,这对于提升图像识别和艺术理解的深度学习模型至关重要。在构建过程中,数据集的清洗与标准化是另一大挑战,这涉及到对艺术作品和艺术家信息的准确抽取与整合。此外,由于艺术领域的多样性和主观性,如何确保数据集的广泛适用性和公正性,避免偏见,也是当前及未来研究的挑战之一。
常用场景
经典使用场景
在艺术史研究领域,MoMA_dataset数据集被广泛用于分析现代艺术的时空分布特征。该数据集收录了现代艺术博物馆中艺术作品的详细信息,包括标题、年份以及作品对应的艺术家ID,是研究者和爱好者洞察艺术流派演变、艺术家创作活跃时期的重要资源。
衍生相关工作
基于MoMA_dataset数据集,研究者们衍生出了一系列相关工作,如艺术作品的风格分类、艺术市场价值评估模型构建等。这些研究不仅加深了对现代艺术的理解,也为艺术品市场和相关政策的制定提供了数据支持和理论依据。
数据集最近研究
最新研究方向
在艺术领域,基于MoMA_dataset的最新研究正致力于深入挖掘现代艺术作品与其创作者之间的内在联系。该数据集的运用,使得学者们能够通过数据驱动的方式探索艺术风格、流派变迁以及艺术家国籍与性别等因素对艺术创作的影响。近期研究着重于构建机器学习模型,以期预测艺术作品的市场价值,以及分析艺术家的创作生涯趋势,这对于艺术市场分析、艺术史研究以及文化遗产保护等领域均具有重要的理论与实践意义。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国高考录取分数线数据

  高考录取分数线,是指普通高等学校招生全国统一考试录取分数线。该分数线,每年高考结束后,由省级教育招生主管部门统计后公布。高考录取分数线分为本科线和专科线。全国各个地方的录取线分科类、分批次确定,科类一般分为文科类、理科类、音乐类(文、理)、美术类(文、理)、体育类等,每一科类又各分为提前批、第一批、第二批等等。  CnOpenData推出中国高考录取分数线数据,从批次、学校、专业等三方面汇总高考录取情况,涵盖生源地、学校所在地、年份、分类、批次、分科、分数线、学校、专业、录取人数、最高/低分等字段,为相关研究提供优质的数据资源。

CnOpenData 收录

UniProt

UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。

www.uniprot.org 收录

VoxBox

VoxBox是一个大规模语音语料库,由多样化的开源数据集构建而成,用于训练文本到语音(TTS)系统。

github 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

Yahoo Finance

Dataset About finance related to stock market

kaggle 收录