five

Warinza008

收藏
Hugging Face2026-02-15 更新2026-02-16 收录
下载链接:
https://huggingface.co/datasets/Gimmenoto/Warinza008
下载链接
链接失效反馈
官方服务:
资源简介:
Lichess Elite 国际象棋张量数据集(2013年-2020年5月)是一个专为深度学习和强化学习研究设计的高维国际象棋棋盘表示数据集。该数据集源自Lichess Elite数据库,涵盖了2013年1月至2020年5月期间的棋局数据。每个棋盘位置被编码为一个结构化的125×8×8浮点张量,包含14个棋子平面、4个王车易位权利通道、2个过路兵通道、4个游戏状态标量通道、6个战术信息通道、2个国王移动性通道、5个兵结构通道、84个历史平面通道、4个移动掩码和评估通道以及1个材料平衡通道。数据集适用于策略预测、胜平负分类、价值网络、AlphaZero风格的监督预训练、位置评估建模和战术学习等任务。
创建时间:
2026-02-06
原始信息汇总

Lichess Elite Chess Tensor Dataset (2013 – May 2020) 数据集概述

基本信息

  • 数据集名称:Lichess Elite Chess Tensor Dataset (2013 – May 2020)
  • 语言:英语
  • 许可证:其他
  • 任务类别:强化学习、其他
  • 标签:国际象棋、棋盘游戏、深度学习、神经网络、lichess、张量数据集
  • 数据规模:10M < n < 700M

数据来源与范围

  • 原始数据集:Lichess Elite Database (https://database.nikonoel.fr/)
  • 数据时间范围:2013年1月至2020年5月
  • 说明:本数据集仅包含此时间范围内的数据,与Lichess无隶属关系,所有权利归原始数据提供者所有。

数据集结构

  • 拆分:仅包含训练集,涵盖所有提取的棋盘局面。

数据特征

列名 类型 描述
board list<list<list<float32>>> 125通道的8×8张量
win bool 若游戏结果为1-0则为真
draw bool 若游戏结果为1/2-1/2则为真
lose bool 若游戏结果为0-1则为真
piece_to_move int64 编码的移动目标(from_square × 64 + to_square)

棋盘张量规范(125个通道)

张量由以下结构化特征组构成:

  1. 棋子平面(14个通道)

    • 二进制位棋盘(存在棋子处为1.0,否则为0.0)。
    • 包含白方棋子(兵、马、象、车、后、王)、黑方棋子(兵、马、象、车、后、王)以及额外的重复象平面。
  2. 王车易位权利(4个通道)

    • 每个通道是一个完整的8×8平面,若权利存在则填充1.0。
    • 包括白方短易位、白方长易位、黑方短易位、黑方长易位。
  3. 吃过路兵(2个通道)

    • 吃过路兵目标方格掩码。
    • 吃过路兵捕获兵方格。
  4. 游戏状态标量(4个通道)

    • 每个标量在整个8×8平面上广播。
    • 包括行棋方(1.0=白方,0.0=黑方)、归一化的半回合时钟(halfmove_clock / 100)、重复≥2次、重复≥3次。
  5. 战术信息(6个通道)

    • 将军子掩码、白方攻击的方格、黑方攻击的方格、白方被牵制的棋子、黑方被牵制的棋子、受威胁的棋子(当前方被攻击的棋子)。
  6. 王机动性(2个通道)

    • 白王合法移动、黑王合法移动。
  7. 兵形结构(5个通道)

    • 白方通路兵、黑方通路兵、孤兵、叠兵、结构压力代理。
  8. 历史平面(84个通道)

    • 最近6个棋盘局面,每个局面包含14个棋子通道。
    • 顺序:最近的位置优先。
    • 每个历史棋盘编码:6个白方棋子平面、6个黑方棋子平面、2个重复的象平面。
  9. 移动掩码与评估(4个通道)

    • 合法移动目标方格、捕获方格、升变方格、机动性标量(legal_moves / 218)。
  10. 子力平衡(1个通道)

    • 归一化的子力差异。
    • 棋子价值:兵=1,马=3,象=3,车=5,后=9。

通道摘要

类别 通道数
棋子 14
王车易位 4
吃过路兵 2
游戏状态 4
战术信息 6
王机动性 2
兵形结构 5
历史 84
移动掩码与机动性 4
子力平衡 1
总计 125

预期用途

本数据集适用于:

  • 策略预测(走子选择)
  • 胜/和/负分类
  • 价值网络
  • AlphaZero风格的监督预训练
  • 局面评估建模
  • 战术学习

创建与目的

  • 创建机构:泰国国王科技大学(KMUTT)计算机科学系。
  • 目的:严格用于教育和学术研究。
搜集汇总
数据集介绍
main_image_url
构建方式
在棋类人工智能研究领域,高质量的数据集是推动算法进步的关键基石。Warinza008数据集源自Lichess精英数据库,其构建过程严谨而系统,覆盖了2013年1月至2020年5月期间的高水平对局。研究人员从原始棋局中提取每一棋步的棋盘状态,并将其编码为125通道的8×8浮点张量,每一通道均对应特定的棋类特征,如棋子位置、王车易位权利、过路兵标志等。整个数据集仅包含训练分割,所有数据均经过统一处理,确保了格式的一致性与完整性,为后续的深度学习与强化学习任务提供了结构化的输入基础。
特点
该数据集的核心特征在于其高维且信息丰富的张量表示。每个棋盘位置被转化为一个125×8×8的浮点张量,其中不仅包含了当前棋子的空间分布,还融入了历史棋盘状态、战术信息、兵形结构以及王权移动性等多维度特征。这种设计使得数据集能够全面捕捉棋局的动态演变与战略细节,例如通过84个历史通道记录最近6步的棋子移动轨迹。此外,数据集还标注了游戏结果(胜、平、负)及移动目标编码,为监督学习任务提供了清晰的标签指引,极大地促进了策略预测与局面评估模型的训练。
使用方法
在人工智能与机器学习研究中,该数据集为多种棋类分析任务提供了实用框架。用户可通过Hugging Face的datasets库直接加载数据集,并利用PyTorch等深度学习框架将张量数据转换为模型可处理的格式。典型应用包括训练策略网络以预测最优棋步、构建价值网络评估局面胜率,以及进行胜-平-负分类任务。数据集适用于AlphaZero风格的监督预训练,也可用于探索战术模式学习与局面评估建模。研究人员应遵循学术用途规范,在模型开发中充分利用其丰富的特征表示,以推动棋类AI算法的创新与优化。
背景与挑战
背景概述
国际象棋人工智能研究长期致力于构建能够模拟人类大师级决策过程的计算模型。在此背景下,Warinza008数据集应运而生,它由泰国国王科技大学计算机科学系的研究团队于2020年后创建,旨在为深度学习和强化学习算法提供高质量、结构化的棋局表示。该数据集的核心研究问题聚焦于如何利用高维张量编码复杂的棋盘状态,以支持策略网络、价值评估及AlphaZero风格模型的训练,从而推动游戏AI在决策精度与泛化能力方面的进步,对相关领域产生了显著的学术影响力。
当前挑战
该数据集旨在解决国际象棋AI中棋局评估与走子策略生成的经典挑战,其难点在于如何从海量对局数据中提取并编码多维度的战术与战略特征,以准确预测复杂局面下的最优决策。在构建过程中,研究团队面临的主要挑战包括:设计一个全面且高效的125通道张量表示方案,以涵盖棋子位置、历史信息、战术动态及局面评估等异构特征;确保从Lichess精英数据库(2013年至2020年)中提取的数据质量与一致性,同时处理原始数据的规模与复杂性;以及为深度学习模型提供适用于监督预训练和强化学习研究的标准化、可扩展的数据格式。
常用场景
经典使用场景
在人工智能与博弈论交叉领域,Warinza008数据集以其高维棋盘张量表示,成为深度强化学习研究的经典基准。该数据集通过125通道的8×8张量编码国际象棋位置,广泛应用于AlphaZero风格的政策网络预训练,支持从海量对局中学习最优走子策略与局面评估,为构建类人棋力的智能体提供了结构化数据基础。
解决学术问题
该数据集有效解决了传统强化学习中样本效率低下与稀疏奖励的学术难题。通过提供大规模标注的棋盘状态与结果标签,研究者能够训练端到端的价值网络与策略网络,推动蒙特卡洛树搜索与神经网络结合的算法发展,并在可解释性人工智能领域为决策过程的可视化分析提供实证数据支撑。
衍生相关工作
受该数据集启发,衍生出多项经典研究工作,包括基于注意力机制的棋盘表示学习架构、融合历史平面的时序预测模型,以及跨模态的强化学习迁移框架。这些工作不仅深化了对象棋决策过程的理解,还促进了神经网络在不完全信息博弈中的适应性研究,为后续开源棋类AI项目提供了可复现的基线模型。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作