five

30-class currency notes and coins dataset

收藏
arXiv2025-10-23 更新2025-10-25 收录
下载链接:
https://arxiv.org/abs/2510.20267v1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了30类纸币和硬币,代表3种货币类型:美元(USD)、欧元(EUR)和孟加拉塔卡(BDT)。数据集由实际场景中的图像组成,通过数据增强技术增加了数据集的大小和多样性。数据集包括所有更新后的货币以及旧货币,以及新纸币和磨损的旧纸币。数据集被分为训练集和验证集,用于模型训练和验证。该数据集旨在解决视障人士独立识别和处理货币的问题。

This dataset contains 30 classes of banknotes and coins, representing three currency types: United States Dollar (USD), Euro (EUR), and Bangladeshi Taka (BDT). It consists of images captured in real-world scenarios, and its scale and diversity are augmented via data augmentation techniques. The dataset includes all updated and legacy versions of the currencies, as well as new banknotes and worn old banknotes. It is split into training and validation subsets for model training and validation. This dataset is designed to address the problem of visually impaired individuals independently identifying and handling currency.
提供机构:
Rajshahi University of Engineering and Technology
创建时间:
2025-10-23
搜集汇总
数据集介绍
main_image_url
构建方式
在金融科技与计算机视觉交叉领域,30类货币纸币与硬币数据集的构建体现了多源数据融合与精细化处理策略。该数据集整合了美元、欧元和孟加拉塔卡三种货币体系,涵盖30种面额的纸币与硬币,通过从公开数据集(如Kaggle的USD Bill Classification Dataset、Euro Currency等)和自主采集的实景图像中筛选原始样本,确保了数据来源的多样性与真实性。构建过程中采用旋转(30°、60°及多角度扩展)、尺寸标准化(640×640像素)等数据增强技术,将原始图像扩展至25,012张,并通过Roboflow平台进行人工标注,重点标注货币区域及面额特征文本,最终按70:15:15比例划分为训练、验证与测试集,为模型训练提供了结构化的基础。
特点
该数据集的核心特征在于其跨货币兼容性与现实场景模拟能力。覆盖美元、欧元和孟加拉塔卡三大货币体系的30种面额,包含流通中及已停用的稀有币种(如孟加拉黄金1塔卡硬币),充分反映了全球货币的多样性。数据样本囊括了折叠、部分可见、不同光照与背景条件下的货币图像,通过增强技术模拟了实际使用中可能遇到的视角变化与磨损情况。标注层面除整体货币区域外,还精准标记了面额数字与货币类型文本(如Taka、Dollar等),排除了通用英文文本的干扰,确保了特征辨识的专属性。这种设计显著提升了模型在复杂环境下的泛化能力与鲁棒性。
使用方法
该数据集专为基于深度学习的货币检测系统优化,支持YOLOv8等目标检测模型的端到端训练与评估。使用者可直接加载经预处理的图像与YOLO格式标注文件,利用训练集学习货币的多尺度特征,并通过验证集调整超参数。测试集用于评估模型在准确率、召回率等指标上的表现,其多样化的样本(如折叠纸币、低光照硬币)有效验证了模型在真实场景的适用性。数据集已公开于Kaggle平台,便于研究者集成至移动应用开发流程,结合实时图像采集与语音反馈模块,构建辅助视障人士的金融工具,推动无障碍技术的实际落地。
背景与挑战
背景概述
随着全球金融体系中现金交易的持续普及,视觉障碍群体在独立处理货币时面临显著困难。2025年,由孟加拉国工程技术大学电子与通信工程系研究人员构建的30类货币数据集应运而生,涵盖美元、欧元和孟加拉塔卡三种货币的纸币与硬币。该数据集旨在通过计算机视觉技术解决视觉障碍者的货币识别问题,其构建融合了真实场景采集与数据增强技术,最终包含25,012张经多角度旋转和标注的图像,为实时货币检测系统的开发奠定了数据基础。
当前挑战
该数据集致力于解决视觉障碍者在货币识别领域的核心难题,包括因纸币磨损、折叠或光照条件差异导致的触觉标记失效问题。在构建过程中,研究人员需应对多国货币的视觉相似性干扰,例如不同面值欧元纸币的纹理接近性;同时,数据采集需覆盖罕见币种与旧版货币,并通过人工标注确保数字与文字特征的精确性,以避免模型将通用英文字符误判为货币标识。此外,数据增强时需平衡旋转与尺度变换的多样性,以提升模型在复杂环境下的鲁棒性。
常用场景
经典使用场景
在计算机视觉辅助技术领域,该数据集最经典的应用场景是训练实时货币检测模型。通过包含美元、欧元和孟加拉塔卡三种货币的30个面额类别,数据集为开发面向视障人士的智能识别系统提供了坚实基础。研究人员利用该数据集训练YOLOv8等先进目标检测算法,使其能够准确识别不同光照条件、折叠状态和拍摄角度下的货币图像,为后续的语音反馈系统提供可靠的数据支持。
实际应用
在实际应用层面,该数据集支撑的货币识别系统已成功部署于移动端应用。通过智能手机摄像头实时捕捉货币图像,系统能在3.1毫秒内完成识别并通过语音播报面额信息,极大提升了视障人士的金融自主能力。这种技术方案不仅适用于日常购物场景,还可扩展至银行ATM机、自助售货机等公共服务设施,为视障群体构建无障碍的金融生态环境,体现了科技向善的社会价值。
衍生相关工作
基于该数据集衍生的经典工作包括多国货币检测模型MBDM和轻量级印度货币识别框架IPCRNet。MBDM采用69层卷积网络结合马赛克数据增强技术,在韩元、美元等多国货币识别任务中取得显著进展;IPCRNet则通过MobileNet前端与多膨胀深度可分离卷积的巧妙设计,在保持高精度的同时大幅降低模型参数量。这些工作共同推动了跨国货币识别技术的标准化进程,为后续研究提供了重要的架构参考和性能基准。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作