yuag-numismatics
收藏Hugging Face2025-04-08 更新2025-04-09 收录
下载链接:
https://huggingface.co/datasets/yale-cultural-heritage/yuag-numismatics
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含超过53,000枚硬币的数据集,收藏于耶鲁大学艺术画廊。数据从耶鲁的Lux收藏发现平台下载。Lux允许用户以新的方式找到并连接耶鲁博物馆、档案馆和图书馆中的文化遗产收藏。这个数据集仅包含具有单张图像的示例,包括来自世界各地的硬币和纸币,尤其是偏向于西欧和美国。图像通常包含硬币和纸币的正反两面。对于纸币,正面通常位于顶部,反面位于底部,而对于硬币,正面位于左侧,反面位于右侧。这个数据集可以用于分类,特别是材料字段。我们也在准备数据集进行图像分割和分类,以分割和识别硬币/纸币的正反两面。
This is a dataset containing over 53,000 coins housed at the Yale University Art Gallery. The data was downloaded from Yale's Lux Collections Discovery Platform. Lux enables users to discover and connect with cultural heritage collections across Yale's museums, archives, and libraries in innovative ways. This dataset only includes samples with a single image each, covering coins and banknotes from around the world, with a particular emphasis on Western Europe and the United States. The images typically feature both the obverse and reverse sides of the included coins and banknotes. For banknotes, the obverse is usually positioned at the top and the reverse at the bottom; for coins, the obverse is placed on the left and the reverse on the right. This dataset can be used for classification tasks, particularly material classification. We are also preparing a dedicated dataset for image segmentation and classification, with the goal of segmenting and identifying the obverse and reverse sides of coins and banknotes.
创建时间:
2025-04-05
原始信息汇总
耶鲁大学艺术画廊钱币收藏数据集概述
数据集基本信息
- 来源机构: 耶鲁大学艺术画廊
- 原始数据来源: Yales Lux Collection Discovery
- 数据量: 53,321条记录(含单张图像的物品)
- 总大小: 84.54 GB
- 下载大小: 83.79 GB
数据特征
| 字段名 | 类型 | 描述 |
|---|---|---|
| image | 图像 | 物品图像 |
| primary_name | 字符串 | 物品主要名称 |
| materials | 字符串 | 制作材料 |
| creation_place | 字符串 | 创作地点 |
| creation_date | 字符串 | 创作日期 |
| earliest_date | 字符串 | 最早日期 |
| latest_date | 字符串 | 最晚日期 |
| responsible_unit | 字符串 | 责任单位 |
| collection | 字符串 | 所属收藏 |
| uuid | 字符串 | 唯一标识符 |
| lux_url | 字符串 | Lux平台链接 |
| types | 字符串 | 物品类型 |
| creators | 字符串 | 创作者 |
| lux_metadata | 字符串 | Lux元数据 |
数据特点
- 地理偏向: 主要包含欧美钱币和纸币
- 图像特征:
- 纸币图像通常上方为正面,下方为背面
- 硬币图像通常左侧为正面,右侧为背面
应用场景
- 材料分类(基于materials字段)
- 图像分割与分类(识别钱币/纸币的正反面)
统计信息
材料分布(前10位)
| 材料 | 数量 | 占比 |
|---|---|---|
| 银 | 15,955 | 29.9% |
| 青铜 | 14,325 | 26.9% |
| 铜 | 12,799 | 24.0% |
| 纸 | 3,235 | 6.1% |
| 墨水 | 3,219 | 6.0% |
| 银铜合金 | 1,556 | 2.9% |
| 黄铜 | 950 | 1.8% |
| 铜镍合金 | 560 | 1.1% |
| 铅 | 472 | 0.9% |
| 镍 | 467 | 0.9% |
创作地点分布(前10位)
| 地点 | 数量 | 占比 |
|---|---|---|
| 罗马 | 5,629 | 10.6% |
| 安条克 | 3,922 | 7.4% |
| 中国 | 3,379 | 6.3% |
| 美国 | 2,339 | 4.4% |
| 奥地利 | 1,554 | 2.9% |
| 英格兰 | 1,458 | 2.7% |
| 君士坦丁堡 | 1,413 | 2.6% |
| 亚历山大 | 1,297 | 2.4% |
| 巴黎 | 1,207 | 2.3% |
| 法国 | 1,196 | 2.2% |
搜集汇总
数据集介绍

构建方式
该数据集源自耶鲁大学艺术画廊的钱币收藏,通过Lux收藏发现平台获取原始数据。研究人员从超过7万件藏品中筛选出仅含单张图像的53,321个样本,确保数据质量与一致性。藏品主要涵盖西方欧美地区的硬币与纸币,每张图像均包含钱币的正反两面,纸币图像采用上下排列方式,硬币则采用左右排列结构。数据采集过程严格遵循博物馆数字化标准,保留了完整的元数据信息链。
特点
该数据集最显著的特点是包含丰富的材质分类信息,其中银质(29.9%)、青铜(26.9%)和铜质(24.0%)占据主导地位。地理分布呈现多元化特征,罗马(10.6%)、安条克(7.4%)和中国(6.3%)为三大主要来源地。图像数据具有标准化的空间结构,钱币正反面保持固定方位,为计算机视觉任务提供理想的研究素材。元数据字段设计严谨,涵盖创作时间、地点、材质等14个维度,支持多维度的学术分析。
使用方法
该数据集特别适用于材质分类的机器学习任务,银、铜等主要材质的充足样本可为分类模型提供可靠训练基础。研究人员可利用其标准化图像结构开发钱币正反面分割算法,纸币与硬币的不同排列方式也为跨类别研究提供对比条件。在数字人文领域,结合创作时间与地理坐标的元数据,可进行钱币文化的时空传播分析。使用时应关注西方样本偏重的数据偏差,建议通过数据增强或迁移学习提升模型泛化能力。
背景与挑战
背景概述
耶鲁大学艺术画廊钱币数据集(yuag-numismatics)是由耶鲁大学艺术画廊整理并发布的一个专业钱币收藏数据集,涵盖了来自全球各地的53,000余枚硬币和纸币。该数据集通过耶鲁大学的Lux收藏发现平台获取,旨在为文化遗产研究提供丰富的图像和元数据支持。数据集中的钱币主要来自西欧和美洲地区,时间跨度广泛,从古代到现代均有涉及。每枚钱币均包含高分辨率图像及详细的元数据,如材质、铸造地点、年代等,为钱币学、考古学及数字人文研究提供了宝贵的资源。
当前挑战
该数据集面临的主要挑战包括:1) 数据多样性不足,尽管数据集规模庞大,但主要集中于西欧和美洲地区的钱币,其他地区的代表性较弱,可能影响模型的泛化能力;2) 图像标注的复杂性,钱币图像通常包含正反两面,且排列方式不一,增加了自动分割和分类的难度;3) 元数据的不完整性,部分钱币的铸造年代或地点信息缺失,可能影响研究的准确性;4) 数据预处理的技术挑战,高分辨率图像的存储和处理需要大量计算资源,增加了研究成本。
常用场景
经典使用场景
在钱币学研究领域,yuag-numismatics数据集为学者提供了丰富的视觉与元数据资源。该数据集包含53,321枚钱币的高清图像及详细材质、铸造地、年代等元数据,特别适合用于钱币图像分类与材质识别研究。通过深度学习模型,研究者能够自动化识别钱币的材质构成(如银、铜、青铜等),分析不同历史时期与地域的钱币特征分布。
实际应用
在博物馆数字化实践中,该数据集可直接用于构建智能钱币鉴定系统。耶鲁大学艺术画廊利用其开发了钱币正反面自动分割算法,提升馆藏管理效率。此外,考古团队通过比对出土钱币与该数据集的铸造地特征(如10.6%的罗马钱币),能够快速定位文物的历史渊源。
衍生相关工作
基于该数据集衍生的经典工作包括《基于多模态学习的古钱币年代预测》等研究,其提出的跨模态嵌入方法被后续学者广泛引用。此外,数据集启发了LUX平台开发钱币知识图谱,将53,000+样本与历史事件、贸易路线关联,推动了数字人文领域的发展。
以上内容由遇见数据集搜集并总结生成



