Mahjong Dataset|计算机视觉数据集|机器学习数据集
收藏Mahjong Dataset 概述
数据集结构
./raw-images
: 原始未切割的图像文件夹。./raw-tiles
: 未缩放的麻将牌图像文件夹。./tiles-resized
: 已缩放、可直接使用的麻将牌图像文件夹。./tiles-data
: 包含图像标签的CSV文件及其模板文件夹。./untagged-images-raw
: 未标记的原始未切割图像文件夹。./untagged-tiles
: 未标记的麻将牌图像文件夹。
数据描述
- 图像来源:主要从Google图像搜索、Ebay和Alibaba收集。
- 缩放图像尺寸:240(W) x 320(H),格式为
.jpg
。
数据集内容
train.zip
: 位于仓库根目录的预打包数据集,包含:images
文件夹:麻将牌图像。data.csv
:图像标签数据。
标签格式
image-name | label | label-name |
---|---|---|
1.jpg | 38 | bonus-winter |
... | ... | ... |
类别信息
table-name | table-index |
---|---|
dots-1 | 1 |
dots-2 | 2 |
dots-3 | 3 |
dots-4 | 4 |
dots-5 | 5 |
dots-6 | 6 |
dots-7 | 7 |
dots-8 | 8 |
dots-9 | 9 |
bamboo-1 | 10 |
bamboo-2 | 11 |
bamboo-3 | 12 |
bamboo-4 | 13 |
bamboo-5 | 14 |
bamboo-6 | 15 |
bamboo-7 | 16 |
bamboo-8 | 17 |
bamboo-9 | 18 |
characters-1 | 19 |
characters-2 | 20 |
characters-3 | 21 |
characters-4 | 22 |
characters-5 | 23 |
characters-6 | 24 |
characters-7 | 25 |
characters-8 | 26 |
characters-9 | 27 |
honors-east | 28 |
honors-south | 29 |
honors-west | 30 |
honors-north | 31 |
honors-red | 32 |
honors-green | 33 |
honors-white | 34 |
bonus-spring | 35 |
bonus-summer | 36 |
bonus-autumn | 37 |
bonus-winter | 38 |
bonus-plum | 39 |
bonus-orchid | 40 |
bonus-chrysanthemum | 41 |
bonus-bamboo | 42 |
许可证
本数据集遵循MIT许可证。

中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
AgiBot World
为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。
github 收录
Wafer Defect
该数据集包含了七个主要类别的晶圆缺陷,分别是:BLOCK ETCH、COATING BAD、PARTICLE、PIQ PARTICLE、PO CONTAMINATION、SCRATCH和SEZ BURNT。这些类别涵盖了晶圆在生产过程中可能出现的多种缺陷类型,每一种缺陷都有其独特的成因和表现形式。数据集不仅在类别数量上具有多样性,而且在样本的多样性和复杂性上也展现了其广泛的应用潜力。每个类别的样本均经过精心标注,确保了数据的准确性和可靠性。
github 收录