Mahjong Dataset
收藏github2024-05-12 更新2024-05-31 收录
下载链接:
https://github.com/Camerash/mahjong-dataset
下载链接
链接失效反馈官方服务:
资源简介:
一个用于中国麻将牌的计算机视觉数据集,包含多种麻将牌图像及其标签,用于机器学习模型的训练和测试。
A computer vision dataset for Chinese Mahjong tiles, containing various images of Mahjong tiles and their corresponding labels, intended for the training and testing of machine learning models.
创建时间:
2019-04-29
原始信息汇总
Mahjong Dataset 概述
数据集结构
./raw-images: 原始未切割的图像文件夹。./raw-tiles: 未缩放的麻将牌图像文件夹。./tiles-resized: 已缩放、可直接使用的麻将牌图像文件夹。./tiles-data: 包含图像标签的CSV文件及其模板文件夹。./untagged-images-raw: 未标记的原始未切割图像文件夹。./untagged-tiles: 未标记的麻将牌图像文件夹。
数据描述
- 图像来源:主要从Google图像搜索、Ebay和Alibaba收集。
- 缩放图像尺寸:240(W) x 320(H),格式为
.jpg。
数据集内容
train.zip: 位于仓库根目录的预打包数据集,包含:images文件夹:麻将牌图像。data.csv:图像标签数据。
标签格式
| image-name | label | label-name |
|---|---|---|
| 1.jpg | 38 | bonus-winter |
| ... | ... | ... |
类别信息
| table-name | table-index |
|---|---|
| dots-1 | 1 |
| dots-2 | 2 |
| dots-3 | 3 |
| dots-4 | 4 |
| dots-5 | 5 |
| dots-6 | 6 |
| dots-7 | 7 |
| dots-8 | 8 |
| dots-9 | 9 |
| bamboo-1 | 10 |
| bamboo-2 | 11 |
| bamboo-3 | 12 |
| bamboo-4 | 13 |
| bamboo-5 | 14 |
| bamboo-6 | 15 |
| bamboo-7 | 16 |
| bamboo-8 | 17 |
| bamboo-9 | 18 |
| characters-1 | 19 |
| characters-2 | 20 |
| characters-3 | 21 |
| characters-4 | 22 |
| characters-5 | 23 |
| characters-6 | 24 |
| characters-7 | 25 |
| characters-8 | 26 |
| characters-9 | 27 |
| honors-east | 28 |
| honors-south | 29 |
| honors-west | 30 |
| honors-north | 31 |
| honors-red | 32 |
| honors-green | 33 |
| honors-white | 34 |
| bonus-spring | 35 |
| bonus-summer | 36 |
| bonus-autumn | 37 |
| bonus-winter | 38 |
| bonus-plum | 39 |
| bonus-orchid | 40 |
| bonus-chrysanthemum | 41 |
| bonus-bamboo | 42 |
许可证
本数据集遵循MIT许可证。
搜集汇总
数据集介绍

构建方式
在构建Mahjong Dataset时,研究者们采用了多源数据采集策略,主要从Google图像搜索、Ebay和Alibaba等平台获取麻将牌的原始图像。这些图像首先被分类存储在不同的文件夹中,包括未切割的原始图像、未缩放的牌图像以及已缩放的可用图像。此外,数据集还包括一个CSV文件,用于存储图像的标签信息,确保每张图像都能与其对应的麻将牌类别相关联。通过这种系统化的数据组织和标注方式,Mahjong Dataset为计算机视觉研究提供了丰富的资源。
特点
Mahjong Dataset的一个显著特点是其图像的高质量和多样性。所有图像均经过缩放处理,尺寸统一为240(W) x 320(H),格式为.jpg,确保了数据的一致性和可用性。此外,数据集包含了详细的标签信息,涵盖了麻将牌的多种类别,如点数牌、条子牌、字牌和花牌等,共计42个类别。这种细致的分类和标注使得该数据集在麻将牌识别和分类任务中具有极高的应用价值。
使用方法
使用Mahjong Dataset时,用户可以直接下载包含所有必要文件的`train.zip`压缩包。该压缩包内含一个`images`文件夹,存储了所有麻将牌的图像,以及一个`data.csv`文件,记录了每张图像的标签信息。用户可以通过读取CSV文件中的标签,将图像与其对应的麻将牌类别进行匹配,从而进行各种计算机视觉任务,如图像分类、对象检测等。此外,数据集的开放源代码许可(MIT License)允许用户自由使用和修改数据,促进了该数据集在学术和工业界的广泛应用。
背景与挑战
背景概述
麻将数据集(Mahjong Dataset)是一个专注于中国麻将牌的计算机视觉数据集,旨在为麻将牌的图像分类和识别提供丰富的资源。该数据集由一组研究人员或机构创建,其核心研究问题是如何准确地识别和分类麻将牌的图像。麻将作为一种广泛流行的桌面游戏,其牌的多样性和复杂性为计算机视觉领域带来了独特的挑战。通过构建这一数据集,研究人员不仅能够推动麻将牌识别技术的发展,还能为其他类似的图像分类任务提供宝贵的参考。
当前挑战
麻将数据集在构建过程中面临多项挑战。首先,麻将牌的种类繁多,包括数字牌、字牌和花牌,每种牌又有不同的图案和颜色,这增加了图像分类的复杂性。其次,数据集的图像主要来源于网络搜索和在线市场,图像质量参差不齐,部分图像可能存在模糊、遮挡或角度问题,这要求在数据预处理阶段进行精细的图像校正和增强。此外,数据集的标签生成也是一个重要挑战,确保每张图像的标签准确无误,需要人工或半自动的标注过程,以避免分类错误。
常用场景
经典使用场景
在计算机视觉领域,Mahjong Dataset 被广泛用于图像分类和对象识别任务。该数据集包含了多种麻将牌的图像,每张图像都经过精细标注,适用于训练和验证深度学习模型。通过使用该数据集,研究人员可以开发出能够准确识别和分类麻将牌的算法,这在游戏自动化和人工智能辅助决策中具有重要应用。
衍生相关工作
基于Mahjong Dataset,许多研究工作得以展开,包括但不限于图像增强、多模态学习和小样本分类。例如,有研究利用该数据集进行图像增强技术的验证,以提高模型在低质量图像上的表现。此外,还有工作探索了如何在小样本情况下有效训练分类模型,为实际应用中的资源受限场景提供了新的解决方案。
数据集最近研究
最新研究方向
在计算机视觉领域,Mahjong Dataset的最新研究方向主要集中在图像识别与分类技术的优化上。随着深度学习技术的不断进步,研究人员正致力于开发更高效的卷积神经网络(CNN)模型,以提高麻将牌的识别准确率。此外,数据增强技术也被广泛应用于该数据集,以提升模型的泛化能力。这些研究不仅推动了麻将牌识别技术的发展,也为其他类似的多类别图像分类问题提供了宝贵的参考。
以上内容由遇见数据集搜集并总结生成



