COIN-Research-Group/sawhill-dataset

Name: COIN-Research-Group/sawhill-dataset
Creator: COIN-Research-Group
Published: 2026-05-01 19:40:49
License: 暂无描述

Hugging Face2026-05-01 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/COIN-Research-Group/sawhill-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含来自MacKenzie Art Gallery的Sawhill Numismatic Collection的硬币视频记录和提取的图像。数据集旨在用于自动硬币识别、文化遗产数字化和钱币学中的计算机视觉应用研究。数据集内容包括手持硬币视频记录、提取的帧序列和参考嵌入。数据集结构包括视频目录、数据目录（包含参考嵌入、参考标签和参考路径）以及输出目录（包含从视频中提取的帧）。数据集还提供了详细的数据字段描述、数据收集方法、处理流程、使用说明、模型信息、局限性、引用、许可证和联系方式。

This dataset contains video recordings and extracted images of coins from the MacKenzie Art Gallerys Sawhill Numismatic Collection. The dataset is designed for research in automated coin identification, cultural heritage digitization, and computer vision applications in numismatics. The dataset includes handheld video recordings of coins, extracted frame sequences, and reference embeddings for automated coin identification using deep learning. The dataset structure consists of directories for raw video recordings, extracted frames, and reference embeddings. The README provides detailed descriptions of data fields, collection methods, processing pipeline, usage instructions, model information, limitations, citation, license, and contact information.

提供机构：

COIN-Research-Group

搜集汇总

数据集介绍

构建方式

在文化遗产数字化与计算机视觉交叉领域中，钱币的自动化识别一直是颇具挑战的前沿课题。Sawhill Numismatic Collection Dataset的构建，正是为了弥合博物馆藏品数字化与深度学习模型应用之间的鸿沟。该数据集源自MacKenzie Art Gallery的Sawhill钱币珍藏，通过手持相机（如iPhone或数码相机）在自然光照及素色背景下，对每一枚钱币进行约三十秒的环绕视频录制，完整呈现钱币的正反两面。随后，从29.97帧每秒的视频中按每秒一帧的间隔提取图像，并经过一套精细的处理管线：首先在LAB色彩空间分析边框颜色统计特征，继而采用Otsu阈值分割与形态学操作，结合连通域分析与基于质心的裁剪，将图像统一缩放至224×224像素。最终，利用在钱币图像上训练的ArcFace模型提取512维L2归一化嵌入向量，构建出包含787条参考嵌入的数据基底。

特点

该数据集展现了鲜明的专业性与前瞻性，其核心特点在于为钱币自动识别任务提供了端到端的多模态支持。除了原始视频与提取帧之外，数据集预先计算了高判别力的512维ArcFace嵌入向量及其对应的标签与路径信息，使研究者可直接跃过繁琐的特征工程阶段，聚焦于匹配与分类算法的优化。自动生成的CSV与JSON标注文件为每一帧提供了包含置信度与候选名单的详尽预测记录，并以视频为单元汇总自动接受与待审核的标签状态，极大便利了半自动化标注流程。数据集的局限性亦被透明呈现：参考图像为摄影棚品质，而视频为手持拍摄，域间差异导致置信度得分处于0.18至0.27区间，这恰恰为研究跨域钱币匹配算法提供了宝贵的基准测试场景。

使用方法

在应用层面，该数据集设计了清晰而灵活的接入路径。研究者可通过Hugging Face Hub的专用脚本，选择完整下载数据集或仅下载处理数据、视频等特定组件，以满足不同算力与存储条件下的需求。加载参考嵌入向量仅需简单几行Python代码，即可将(787, 512)的嵌入矩阵与标签数组载入内存，进而计算余弦相似度实现钱币匹配。对于希望处理新视频的用户，项目提供了自动标注管线，可对输入视频执行帧提取、分割与嵌入比对，并输出格式统一的预测结果。同时，数据集的GitHub仓库配备了上传脚本，便利新增视频文件与处理结果的回传更新，形成从数据采集到模型验证的完整工作流闭环。

背景与挑战

背景概述

Sawhill Numismatic Collection Dataset由MacKenzie Art Gallery于2026年创建，旨在推动钱币学领域的自动化识别与文化遗产数字化研究。该数据集聚焦于通过深度学习技术从手持视频中自动识别硬币，核心研究问题在于弥合高质量工作室摄影与便携式设备拍摄之间的域差异。作为首个面向钱币识别的多模态公开数据集，它提供了包含原始视频、预提取帧序列及512维ArcFace嵌入向量的完备资源，为图像分类、特征提取和目标检测任务提供了标准化基准。其发布显著提升了钱币学与计算机视觉交叉领域的研究可重复性，对文化遗产保护技术的智能化转型具有里程碑意义。

当前挑战

该数据集面临的核心挑战在于跨域匹配的可靠性：参考图像为受控光照下的专业摄影，而待识别视频存在自然光变化、手持抖动及背景干扰，导致相似度置信度普遍偏低（典型值仅0.18-0.27）。构建过程中，硬币分割算法在复杂背景下的稳定性不足，需结合LAB色彩空间统计与Otsu阈值进行多步骤形态学处理；此外，仅787条参考嵌入向量的数据库规模限制了稀有钱币的覆盖度，且自动标注流程产生的低置信度预测（约占总样本的81%）需要大量人工复核，显著增加了标注成本与质量控制难度。

常用场景

经典使用场景

在文化遗产数字化与计算机视觉交叉研究领域，sawhill-dataset为钱币学自动识别任务提供了标准化的评测基准。该数据集收录了MacKenzie艺术馆Sawhill钱币收藏的高清视频记录与抽帧图像，并配套了经ArcFace模型预计算的512维特征嵌入向量。研究人员可利用其完成三大经典任务：基于视频帧或静态图像的钱币分类、通过余弦相似度进行特征匹配的钱币检索，以及借助Otsu阈值分割与形态学操作实现的感兴趣区域检测。这些功能共同支撑起从原始视频采集到最终识别结果的完整流水线验证。

衍生相关工作

围绕sawhill-dataset衍生出的一系列代表性工作涵盖了特征学习、分割优化与系统集成三个方向。在特征学习方面，基于ResNet-50骨干网络与ArcFace损失函数训练的钱币嵌入模型已成为基准方法，其512维L2归一化表征被后续研究广泛用作比对基线。在分割前处理环节，研究者利用LAB颜色空间的边界统计与Otsu自适应阈值算法构建了鲁棒的感兴趣区域提取模块。此外，配套发布的自动化标注工具autolabel可直接应用于其他钱币收藏的数字化流程，形成了从特征提取到在线推理的完整工具箱生态。

数据集最近研究