five

MAMe-Dataset

收藏
Hugging Face2024-10-07 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/HPAI-BSC/MAMe-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
MAMe数据集是一个专注于博物馆藏品中艺术作品媒介识别的图像分类数据集。它包含来自三个不同博物馆的数千件艺术品,并提出了一项分类任务,即由艺术专家监督下区分29种媒介(即材料和技术)。数据集包括图像文件、媒介、博物馆、博物馆实例ID、子集、宽度、高度、产品尺寸和宽高比等特征。数据集有两个变体:MAMe_small用于快速实验,MAMe_original用于高精度任务。该数据集仅用于非商业研究目的。
创建时间:
2024-10-02
原始信息汇总

MAMe Dataset: Museum Artworks Medium

概述

MAMe Dataset 是一个专注于艺术品和博物馆藏品中材料识别的图像分类数据集。数据集包含来自三个不同博物馆的数千件艺术品,旨在区分29种不同的材料和技法。

数据集特征

  • Image file: 图像文件路径
  • Medium: 材料类型
  • Museum: 博物馆名称
  • Museum-based instance ID: 基于博物馆的实例ID
  • Subset: 子集分类
  • Width: 图像宽度
  • Height: 图像高度
  • Product size: 产品尺寸
  • Aspect ratio: 宽高比

数据集配置

  • config_name: default
  • splits:
    • train
  • data_files:
    • split: train path: data/dataset.csv
  • download_mode: reuse_dataset_if_exists

数据集变体

  • MAMe_small: 压缩后的玩具版本,适用于快速实验和减少存储需求。
  • MAMe_original: 完整版本,适用于需要高精度材料分类的任务,包含205 GB的图像。

数据集描述

  • Curated by: HPAI
  • License: 仅用于非商业研究目的

引用

如果使用此数据集,请引用以下期刊论文: bibtex @article{pares2022mame, title={The MAMe dataset: on the relevance of high resolution and variable shape image properties}, author={Par{e}s, Ferran and Arias-Duart, Anna and Garcia-Gasulla, Dario and others}, journal={Applied Intelligence}, volume={52}, number={12}, pages={11703--11724}, year={2022}, publisher={Springer}, doi={10.1007/s10489-021-02951-w} }

数据集卡片作者

数据集卡片联系

更多信息或问题,请联系 HPAI organization

搜集汇总
数据集介绍
main_image_url
构建方式
MAMe数据集专注于博物馆艺术品媒介的识别,其构建过程涉及从三个不同博物馆中收集数千件艺术品图像,并由艺术专家进行标注。数据集中的图像涵盖了29种不同的媒介类别,包括从简单的材料(如青铜、银或金)到复杂的高层次技术(如彩陶、木刻或编织织物)。这些图像经过精心筛选和分类,确保了数据的高质量和多样性。
特点
MAMe数据集的特点在于其广泛的媒介类别和高分辨率的图像数据。数据集中的图像不仅具有高分辨率,还包含了不同形状和尺寸的艺术品,这为图像分类任务提供了丰富的视觉信息。此外,数据集的媒介类别涵盖了从传统到现代的各种艺术形式,使得该数据集在艺术材料识别领域具有重要的研究价值。
使用方法
MAMe数据集的使用方法主要包括图像分类任务,用户可以通过加载数据集中的图像和对应的媒介标签进行模型训练和评估。数据集提供了两个版本:MAMe_small和MAMe_original,前者适用于快速实验和存储需求较低的场景,后者则适用于需要高精度材料分类的任务。用户可以通过命令行或直接下载链接获取数据集,并根据需要选择适合的版本进行使用。
背景与挑战
背景概述
MAMe数据集由HPAI机构于2020年创建,旨在解决艺术品材料与技术的多类别分类问题。该数据集聚焦于博物馆藏品的图像分类,涵盖了29种不同的艺术媒介,如油画、青铜和木刻等。这些媒介不仅包括简单的材料属性,还涉及复杂的高级技术。MAMe数据集的构建得到了艺术专家的指导,并基于来自三家博物馆的数千件艺术品图像。该数据集在艺术材料识别领域具有重要影响力,为相关研究提供了高质量的基准数据。
当前挑战
MAMe数据集在解决艺术品材料分类问题时面临多重挑战。首先,艺术媒介的多样性要求模型能够同时捕捉细节特征和整体图像结构,这对算法的设计提出了较高要求。其次,数据集中图像的形状和分辨率差异较大,增加了模型训练的复杂性。在构建过程中,研究人员还需克服艺术品图像的高分辨率和大尺寸带来的存储与处理难题。此外,确保数据标注的准确性和一致性也是一项重要挑战,尤其是在涉及复杂艺术技术时,专家的参与至关重要。
常用场景
经典使用场景
MAMe数据集在艺术材料识别领域具有广泛的应用,尤其是在博物馆艺术品分类和文化遗产保护方面。该数据集通过提供数千件来自不同博物馆的艺术品图像,涵盖了29种不同的材料和技法,为图像分类任务提供了丰富的训练样本。研究人员可以利用这些数据进行深度学习模型的训练,以识别艺术品的材料和制作技法,从而推动艺术史研究和文化遗产数字化保护的发展。
实际应用
在实际应用中,MAMe数据集被广泛用于博物馆的数字化管理和文化遗产保护。通过利用该数据集训练的图像分类模型,博物馆可以自动化地识别和分类馆藏艺术品的材料和技法,从而提高管理效率。此外,该数据集还可用于开发虚拟博物馆和在线展览,使公众能够更便捷地访问和理解艺术品的背景信息。
衍生相关工作
MAMe数据集衍生了许多相关研究,尤其是在艺术材料识别和图像分类领域。基于该数据集的研究工作包括改进深度学习模型以处理高分辨率和可变形状图像,以及开发新的算法来提高艺术材料识别的准确性。此外,该数据集还促进了跨学科合作,推动了计算机视觉、艺术史和文化遗产保护领域的融合与创新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作