Hanafuda-Object-Detection
收藏Hugging Face2026-04-14 更新2026-04-15 收录
下载链接:
https://huggingface.co/datasets/tarumino3/Hanafuda-Object-Detection
下载链接
链接失效反馈官方服务:
资源简介:
Hanafuda目标检测数据集是一个专门用于传统日本花札牌的目标检测数据集。该数据集包含300张标注图像,共计2,232个边界框,采用YOLO格式标注。数据集特点包括真实世界中的类别不平衡(如常见的“Kasu”牌出现频率较高)、实际游戏场景的模拟(如重叠、手持和散落的牌局布局),以及使用标准任天堂花札牌进行数据采集。数据集统计信息显示,平均每张图像有7.44个标注,共包含36个独特的牌类。数据集以统一集合形式提供,未预设训练/验证集划分,便于研究者自定义数据分割策略。
创建时间:
2026-04-13
原始信息汇总
Hanafuda Object Detection Dataset 概述
数据集基本信息
- 名称: Hanafuda Object Detection Dataset
- 许可证: CC BY 4.0
- 描述: 这是一个专门用于花札(日本传统纸牌)的目标检测数据集。
数据集内容与规模
- 图像总数: 300张
- 标注框总数: 2,232个
- 每张图像平均标注数: 7.44个
- 类别总数: 36个独特的花札牌类别
- 标注格式: YOLO格式(归一化的
class_id x_center y_center width height) - 类别定义文件:
classes.txt
数据集特点
- 数据性质: 非合成数据集,捕捉了真实世界花札游戏固有的类别不平衡性。
- 长尾分布: 常见的“Kasu”(普通牌)出现频率远高于其他类别。这主要源于花札牌组的结构:大多数月份包含两张“Kasu”牌(十一月有一张,十二月有三张)。同一月份内的“Kasu”牌虽有细微视觉差异,但被归为单一标签(例如,所有三张十二月普通牌都标记为
12-kas)。这种分组方式使得“Kasu”类别的实例数量相较于严格唯一的牌类被放大。- 高频示例:
12-kas(包含3种不同的牌面设计) - 低频示例:
01-hkr-tsuru(仅1种不同的牌面设计)
- 高频示例:
- 实用场景: 图像包含重叠的牌、手持的牌和散落的布局,以模拟实际的推理条件。
- 使用牌组: 数据集使用标准的任天堂花札实体牌组创建。
文件结构
数据集作为一个统一的集合提供,没有预定义训练/验证分割,以便研究人员实施自己的交叉验证或数据分割策略。
. ├── images/raw/ # 300张源图像 (.JPG) ├── labels/raw/ # 300个YOLO标注文件 (.txt) ├── classes.txt # 类别索引映射 └── notes.json # 导出元数据
使用与训练建议
-
下载方式: 可通过Hugging Face CLI下载。 bash hf download tarumino3/Hanafuda-Object-Detection --local-dir ./data --repo-type dataset
-
训练建议:
- 数据分割: 在开始训练前,将
images/和labels/目录随机分割为训练集和验证集(例如,80/20比例)。 - 处理不平衡: 对少数类别实施Focal Loss或使用加权随机采样器。
- 数据增强: 应用马赛克、旋转和缩放增强,以提高稀有牌的检测鲁棒性。
- 评估指标: 依赖平均精度均值(mAP)来正确评估所有48个类别的性能,而非全局准确率。
- 数据分割: 在开始训练前,将
相关资源
- 模型与训练代码: 完整的YOLO模型训练源代码、推理脚本和实用程序可在GitHub获取:https://github.com/tarumino3/Hanafuda-YOLO
搜集汇总
数据集介绍

构建方式
在传统日本花札游戏的文化背景下,该数据集通过采集真实物理卡牌图像构建而成。研究者使用标准任天堂花札牌组,精心拍摄了300张自然场景下的图像,涵盖了手持、重叠及散落等多种实际游戏布局,以模拟真实推理条件。所有图像均采用YOLO格式进行标注,共计2232个边界框,标注过程中依据月份与卡牌类型将视觉相近的普通牌归为同一类别,如十二月三张普通牌统一标记为`12-kas`,从而在保留类别独特性的同时,真实反映了游戏内在的类别分布特性。
特点
该数据集显著体现了现实世界中花札游戏的类别不平衡性,呈现出典型的长尾分布特征。普通牌类别因涵盖同月份内多张设计相似的卡牌而实例数量较高,而如`01-hkr-tsuru`等独特卡牌则出现频率极低。图像内容包含重叠、手持及散乱排列的卡牌,增强了数据集的实用性与挑战性。数据以统一集合形式提供,未预设训练与验证划分,支持研究者根据需求自定义数据分割策略,适用于评估模型在非平衡数据上的鲁棒性。
使用方法
为有效利用该数据集,建议首先使用Hugging Face CLI工具下载完整数据,随后自行划分训练集与验证集,例如采用80/20的比例。针对类别不平衡问题,可引入焦点损失或加权随机采样以提升少数类别的检测性能。数据增强方面,推荐应用马赛克、旋转及缩放等变换来增强模型对稀有卡牌的识别能力。评估时宜采用平均精度均值等指标,以全面衡量模型在所有类别上的表现,避免因全局准确率而忽略少数类别的检测效果。
背景与挑战
背景概述
在计算机视觉与文化遗产数字化交叉领域,针对传统游戏道具的自动识别研究逐渐兴起。Hanafuda-Object-Detection数据集由研究人员tarumino3于近年创建,专注于日本传统花札纸牌的目标检测任务。该数据集旨在解决花札牌面在复杂真实场景中的精准定位与分类问题,其核心研究价值在于为少数类样本识别和长尾分布学习提供了宝贵的实证数据。通过模拟实际游戏中的牌面重叠、手持及散落布局,该数据集推动了目标检测模型在非均匀数据分布下的泛化能力研究,并对数字人文领域的器物识别技术发展产生了积极影响。
当前挑战
该数据集首要挑战源自其试图解决的花札牌面检测问题本身:在自然场景中,卡片常呈现部分遮挡、角度旋转及光照变化,要求模型具备强大的几何与外观不变性。其次,数据构建过程面临显著挑战:数据集基于实体牌组采集,天然继承了花札牌面的长尾分布特性——常见‘Kasu’类别因涵盖多张牌面而实例数量远超稀有类别,导致严重的类别不平衡;同时,标注过程需处理同一月份内‘Kasu’牌的细微视觉差异,并统一归类,这对标注一致性与类别定义提出了较高要求。此外,有限的图像样本规模(仅300张)进一步加剧了模型过拟合与泛化不足的风险。
常用场景
经典使用场景
在计算机视觉与目标检测领域,Hanafuda-Object-Detection数据集为研究长尾分布问题提供了经典范例。该数据集专注于日本传统花札纸牌的识别,其图像捕捉了真实游戏场景中的卡片重叠、手持及散落布局,模拟了实际推理条件。通过包含300张标注图像和2,232个边界框,研究者能够利用YOLO格式直接训练模型,特别适用于探索在类别不平衡情况下如何提升少数类别的检测精度,从而推动目标检测算法在非均匀数据分布下的鲁棒性研究。
实际应用
在实际应用层面,Hanafuda-Object-Detection数据集直接服务于文化遗产数字化与游戏智能化领域。基于该数据集训练的模型可用于开发自动花札识别系统,辅助玩家进行游戏计分或规则学习,亦可在博物馆或教育机构中实现卡牌的快速分类与展示。其模拟的真实场景如卡片重叠和手持状态,确保了模型在复杂环境下的部署效果,为传统纸牌游戏的数字保存与交互体验提供了技术支撑,体现了计算机视觉在保护与推广传统文化中的实用价值。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作。例如,配套的GitHub仓库“tarumino3/Hanafuda-YOLO”提供了完整的YOLO模型训练代码与推理工具,成为后续研究的基础框架。在方法学上,研究者们借鉴其长尾分布特性,探索了数据增强策略如马赛克和旋转变换,以及加权随机采样等技术,以优化少数类别的检测性能。这些工作不仅推动了花札特定领域的算法进步,也为更广泛的类别不平衡目标检测任务提供了可迁移的解决方案,促进了学术与工程实践的紧密结合。
以上内容由遇见数据集搜集并总结生成



