Punches Object Detection Dataset

Name: Punches Object Detection Dataset
Creator: 格罗宁根大学
Published: 2025-01-22 04:30:51
License: 暂无描述

arXiv2025-01-22 更新2025-01-24 收录

下载链接：

https://github.com/marcozullich/punches-object-detection

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由格罗宁根大学的研究团队创建，旨在支持中世纪面板画中打孔图案的细粒度识别。数据集包含8幅高分辨率面板画图像，涵盖了13至14世纪托斯卡纳地区的艺术作品。每幅图像中的打孔标记经过手动标注，共计3475个标记，分布在27个类别中。数据集的创建过程包括与艺术史专家合作，选择具有代表性的画作，并使用Adobe Photoshop进行精确标注。该数据集主要用于训练深度学习模型，以自动检测和分类面板画中的打孔图案，从而辅助艺术史学家进行作品鉴定和分类工作。

This dataset was developed by a research team at the University of Groningen, aiming to support fine-grained recognition of punched patterns in medieval panel paintings. The dataset contains 8 high-resolution panel painting images, covering artworks created in Tuscany during the 13th to 14th centuries. Punched marks in each image were manually annotated, with a total of 3,475 marks distributed across 27 categories. The dataset construction process involved collaborating with art history experts to select representative paintings, followed by precise annotation using Adobe Photoshop. This dataset is primarily used to train deep learning models for automatic detection and classification of punched patterns in panel paintings, thereby assisting art historians in artwork authentication and classification work.

提供机构：

格罗宁根大学

创建时间：

2025-01-22

原始信息汇总

数据集概述

数据集名称

Punches Object Detection

数据集用途

该数据集用于中世纪面板绘画中的精细图案识别，特别是用于检测和识别面板绘画中的“punch”图案。

数据集获取

目前数据集尚未公开托管，需通过邮件联系 marco.zullich@gmail.com 获取访问权限。

数据集结构

数据集采用YOLO格式进行组织，包含以下结构：

split // 例如：train, val, test |

images
labels
images 文件夹包含图像数据。
labels 文件夹包含相应的标签数据。

数据集配置

使用 dataset.yaml 文件配置数据集路径，需为每个数据集划分（train, val, test）指定 images 文件夹的路径。

数据集处理

图像分割

对于自定义数据集，需使用 split_img.py 脚本将高分辨率图像分割为窗口。脚本会生成两个子文件夹：

images：包含裁剪后的图像。
labels：包含相应的标签文件。此外，还会生成一个文件，记录每个窗口在原图像中的位置信息。

预测合并

使用 merge_predictions.py 脚本合并窗口预测结果，生成合并后的预测文件。

指标计算

使用 eval_metrics.py 脚本计算模型性能指标，生成指标文件。

引用

该数据集及相关研究将在 EvoMUSART 2025 会议上发表，引用格式如下： bibtex @inproceedings {bruegger2025largeimage, author = "Bruegger, Josh and Catana, Diana and Macovaz, Vanja and Sabatelli, Matthia, and Valdenegro-Toro, Matias and Zullich, Marco", title = "Large-image Object Detection for Fine-grained Recognition of Punches Patterns in Medieval Panel Painting", booktitle = "EvoMUSART", year = "2025" }

搜集汇总

数据集介绍

构建方式

Punches Object Detection Dataset的构建基于对中世纪托斯卡纳地区13至14世纪木板画中重复的机械压印图案（称为punch）的识别与分类。研究团队首先从意大利比萨国家博物馆获取了8幅超高分辨率的木板画图像，这些画作中包含了来自有限艺术家的punch装饰。由于图像尺寸巨大且punch标记相对较小，研究采用了滑动窗口方法，将图像分割为多个重叠的帧，随后使用YOLOv10模型进行目标检测。通过自定义的非极大值抑制（NMS）策略，将多个帧的预测结果合并，最终生成整幅图像的检测结果。

使用方法

Punches Object Detection Dataset的使用方法主要围绕目标检测任务展开。研究人员首先将高分辨率图像分割为1088×1088像素的帧，并通过滑动窗口方法进行推理。每个帧通过YOLOv10模型进行punch标记的检测，随后使用自定义的非极大值抑制（NMS）策略合并重叠帧的预测结果。该数据集可用于训练和评估深度学习模型，特别是针对高分辨率图像中的小目标检测任务。此外，该数据集还可用于艺术史研究，帮助艺术史学家通过punch标记的自动识别与分类，辅助画作的作者归属研究。

背景与挑战

背景概述

Punches Object Detection Dataset 是由荷兰格罗宁根大学的研究团队于2025年创建的，旨在通过机器学习技术自动化识别中世纪托斯卡纳地区13至14世纪木板画中的机械压印图案（称为“punch”）。这些图案与特定艺术家或工作室之间存在显著关联，因此可用于辅助艺术品的作者归属研究。该数据集包含8幅超高分辨率的木板画图像，涵盖了多个艺术家的作品，并通过YOLOv10模型进行目标检测训练。这一研究为艺术史学家提供了一种定量分析工具，显著减少了传统手工测量和分类的繁琐过程。

当前挑战

Punches Object Detection Dataset 面临的主要挑战包括两个方面。首先，在领域问题方面，尽管punch图案与艺术家之间存在关联，但其形状和分布复杂多样，且图案尺寸较小，检测精度要求极高。其次，在数据集构建过程中，由于图像分辨率极高（部分图像边长超过50,000像素），直接应用机器学习模型计算量巨大，难以处理。研究团队通过滑动窗口方法将图像分割为多个小帧，并结合自定义的非极大值抑制策略来解决这一问题。此外，数据集中类别分布不均衡，部分punch类别样本过少，进一步增加了模型训练的难度。

常用场景

经典使用场景

Punches Object Detection Dataset 主要用于中世纪面板绘画中的精细图案识别，特别是针对13至14世纪托斯卡纳地区的面板绘画中重复出现的机械压印图案（称为punch）。该数据集通过高分辨率图像捕捉这些图案，并利用YOLOv10等深度学习模型进行目标检测，帮助艺术史学家自动化地识别和分类这些图案，从而支持艺术品的作者归属研究。

解决学术问题

该数据集解决了艺术史研究中手工识别和分类punch图案的繁琐问题。传统上，艺术史学家依赖于主观的视觉评估和手工测量，耗时且容易出错。通过引入机器学习技术，该数据集能够自动化地提取和分类punch图案，显著提高了识别效率和准确性，为艺术品的作者归属提供了定量化的支持。

实际应用

在实际应用中，Punches Object Detection Dataset 可用于博物馆和艺术研究机构的艺术品鉴定工作。通过自动化工具，艺术史学家可以快速识别和分类面板绘画中的punch图案，辅助确定艺术品的作者或工作室来源。此外，该技术还可用于艺术品的修复和保护，帮助识别和记录艺术品的独特特征。

数据集最近研究