Chessboard-digital-images_with_fen

Hugging Face2025-04-27 更新2025-04-28 收录

下载链接：

https://huggingface.co/datasets/MohammedHemed/Chessboard-digital-images_with_fen

下载链接

链接失效反馈

官方服务：

资源简介：

棋盘检测数据集包含总共64,386张棋盘图片及其对应的YOLO格式标签文件。数据集分为训练集和验证集，分别包含57,928和6,458张图片及标签。标签文件中包含棋盘上棋子的边界框，采用YOLO格式。数据集包含12个类别，包括6种白色棋子和6种黑色棋子。数据集是通过从Lichess平台获取的棋局数据生成的，使用python-chess API将FEN字符串转换为渲染的棋盘图片，并通过自定义脚本提取对象注释并转换为YOLO格式的.txt文件。该数据集适用于训练物体检测模型、检测棋盘上的单个棋子以及将棋盘图片转换回数字游戏状态（FEN）。数据集根据知识共享署名4.0国际（CC BY 4.0）许可证分发。

The chessboard detection dataset contains a total of 64,386 chessboard images and their corresponding YOLO-format label files. The dataset is split into training and validation sets, with 57,928 and 6,458 images and their corresponding labels, respectively. The label files contain bounding boxes of chess pieces on the chessboard, adhering to the YOLO format. The dataset includes 12 categories, encompassing 6 types of white chess pieces and 6 types of black chess pieces. This dataset is generated using game data collected from the Lichess platform. Specifically, the python-chess API is utilized to convert FEN strings into rendered chessboard images, while custom scripts are deployed to extract object annotations and convert them into YOLO-formatted .txt files. This dataset is applicable for training object detection models, detecting individual chess pieces on chessboards, and converting chessboard images back into digital game states (FEN). The dataset is distributed under the Creative Commons Attribution 4.0 International (CC BY 4.0) license.

创建时间：

2025-04-25

原始信息汇总

Chessboard Detection Dataset 概述

基本描述

数据集名称: Chessboard Detection Dataset
语言: 英文 (en)
许可证: Creative Commons Attribution 4.0 International (CC BY 4.0)
任务类别: 目标检测 (object-detection)
任务ID: object-detection-yolo
规模分类: 10K<n<100K

数据集内容

总图像数量: 64,386
- 训练集 (train): 57,928
- 验证集 (val): 6,458
总标签数量: 64,386 (每个图像对应一个 .txt 文件)
- 训练集 (train): 57,928
- 验证集 (val): 6,458

标注信息

标注格式: YOLO格式
类别数量: 12
- 白色棋子: 6类
- 黑色棋子: 6类

数据来源与处理

数据来源: Lichess平台提供的国际象棋游戏数据（PGN格式）
处理工具:
- python-chess API（用于将FEN字符串转换为棋盘图像）
- 自定义脚本（用于分割棋盘并提取对象标注）

应用场景

训练目标检测模型（如YOLOv5, YOLOv8等）
检测棋盘上的单个棋子
将棋盘图像转换回数字游戏状态（FEN）

许可证信息

许可证类型: CC BY 4.0

搜集汇总

数据集介绍

构建方式

在国际象棋人工智能研究领域，精准的棋盘状态识别是关键技术之一。该数据集通过系统化的数据采集流程构建而成，首先从知名在线象棋平台Lichess获取大量对局的PGN格式数据，利用内置的FEN字符串记录每个棋步的完整棋盘状态。基于python-chess API将FEN字符串转换为可视化棋盘图像，再通过定制化脚本将棋盘划分为8×8方格，自动生成每枚棋子的边界框标注，最终转化为YOLO格式的标注文件。

特点

作为目前规模较大的象棋棋盘检测数据集，其包含64,386张高质量棋盘图像及对应标注，按照9:1比例划分为训练集和验证集。数据集涵盖12个细粒度类别，完整包含黑白双方的6种棋子类型。独特的价值在于每张图像都源自真实对局的棋局状态，且通过程序化方式确保标注的精确性，为棋盘识别任务提供了可靠的基准数据。

使用方法

该数据集主要面向计算机视觉领域的物体检测任务，特别适合训练YOLO系列等现代检测模型。研究人员可直接加载预划分的训练验证集，利用YOLO格式标注进行端到端模型训练。高级应用场景包括实时棋盘状态数字化，通过检测模型输出重建FEN字符串，为象棋分析引擎提供视觉接口。数据采用CC BY 4.0许可，允许学术和商业用途的灵活使用。

背景与挑战

背景概述

国际象棋棋盘数字化图像数据集（Chessboard-digital-images_with_fen）由Lichess平台提供的海量对局数据构建而成，旨在通过计算机视觉技术实现棋盘状态的自动识别与数字化转换。该数据集由研究团队利用python-chess API将PGN格式棋局中的FEN字符串转化为棋盘图像，并采用自定义脚本生成YOLO格式的标注文件，包含64,386张图像及对应棋子位置标注。作为计算机视觉与棋类AI交叉领域的重要资源，该数据集为棋盘状态识别、棋子检测等任务提供了标准化基准，推动了棋局数字化分析技术的发展。

当前挑战

该数据集构建面临双重技术挑战：在领域问题层面，棋子检测需克服棋盘格纹干扰、不同视角下棋子形态变化以及光照条件差异导致的识别困难；在数据构建层面，FEN字符串到视觉标注的精确转换要求处理特殊棋局状态（如王车易位、兵升变），而大规模数据生成过程中还需保持棋盘几何结构的严格一致性。此外，黑白棋子的类别平衡与遮挡情况下的标注准确性，均为模型训练带来显著挑战。

常用场景

经典使用场景

在计算机视觉领域，棋盘检测与棋子识别一直是极具挑战性的任务。该数据集通过提供大量标注精确的棋盘图像及其对应的YOLO格式标签文件，为训练高性能目标检测模型提供了理想素材。研究人员可利用该数据集开发能够准确识别棋盘上各类棋子的深度学习模型，特别是针对国际象棋这种具有严格空间布局的棋类游戏。

衍生相关工作

该数据集已催生了一系列创新性研究工作。基于其开发的YOLO系列目标检测模型在棋子识别任务中展现出卓越性能。部分研究团队进一步探索了棋盘状态重建算法，将视觉识别结果反向转换为FEN字符串。还有工作专注于提升模型在复杂光照条件下的鲁棒性，这些研究共同推动了计算机视觉在棋类分析领域的进步。

数据集最近研究