fishnet-evals

Hugging Face2025-04-25 更新2025-04-26 收录

下载链接：

https://huggingface.co/datasets/nfiekas/fishnet-evals

下载链接

链接失效反馈

官方服务：

资源简介：

Lichess数据库中的棋盘位置及其Stockfish评估值数据集。该数据集包含了从Lichess数据库中提取的棋盘位置，这些位置的评估值是通过Lichess的分布式Stockfish分析（fishnet）计算得出的，使用了不同版本的Stockfish。数据集包含以下列： fen（棋盘位置的FEN表示），cp（棋盘位置的评估值，以兵分数表示），mate（将死前的步数），move（下一着的人类玩家的走法）。评估值始终从白方的视角给出，正数表示白方占优。所有走法均以Chess960模式给出。

创建时间：

2025-04-25

原始信息汇总

Lichess数据库位置与Stockfish评估数据集

数据集概述

来源：从https://database.lichess.org/提取的位置与评估数据
评估工具：使用Lichess分布式Stockfish分析工具fishnet计算，涉及多个Stockfish版本
许可协议：CC0 1.0

数据字段说明

字段名	类型	描述
`fen`	string	评估位置的FEN表示法。仅当存在完全合法的en passant移动时才包含en passant方块
`cp` / `mate`	int或null	由Stockfish计算的以centipawns或将死步数为单位的带符号评估值。两者中必有一个为非null。始终从白方角度给出，正值表示白方优势
`move`	string或null	人类玩家的下一步移动的UCI表示法（如果有）。始终为Chess960模式（王车易位时王移动到车的位置）

已知问题

即使mate评估也不能完全保证正确，尤其是2016年之前产生的评估
2016-12、2020-07和2020-08月份的数据被有意省略，因间歇性错误导致这些月份产生大量错误评估

搜集汇总

数据集介绍

构建方式

在国际象棋数据分析领域，fishnet-evals数据集通过系统化采集Lichess平台对局数据构建而成。该数据集的核心内容来源于https://database.lichess.org/，采用分布式Stockfish分析系统fishnet进行多版本引擎评估，确保了评估结果的权威性。数据记录包含FEN棋局表示法、以白方视角的评估分值（分为兵值分和将死步数两种形式）以及人类玩家的实际落子信息，其中2016年12月、2020年7-8月因评估系统故障被排除在数据集外。

特点

作为国际象棋AI研究的重要基准数据集，其显著特征体现在三个方面：采用标准化的FEN格式完整记录棋局状态，包含en passant特殊着法标识；评估结果以双维度呈现，既包含精确到百分之一的兵值评估（cp），也提供将死步数预测（mate）；特别标注人类玩家的实际决策记录，为研究人类与AI决策差异提供了宝贵数据。需要注意的是早期数据中某些将死评估可能存在误差，这为研究评估算法演进提供了天然对照组。

使用方法

该数据集主要服务于国际象棋AI开发和棋局分析研究领域。使用时需注意评估值始终以白方视角呈现，负值表示黑方优势。研究人员可通过FEN字段重建原始棋局，结合cp/mate双指标分析局面优劣，利用move字段对比AI评估与人类实际选择的差异。由于采用CC0许可协议，使用者可自由进行数据分析、模型训练等科研活动，但需注意2016年前数据的潜在误差问题，建议通过时间维度进行分段验证。

背景与挑战

背景概述

fishnet-evals数据集源于国际象棋在线平台Lichess，旨在通过分布式Stockfish引擎分析海量棋局位置评估数据。该数据集由Lichess开发团队主导构建，其核心价值在于将专业级棋局评估能力转化为可量化研究的结构化数据，为计算机博弈论和人工智能棋类研究提供了重要基准。通过记录每个棋局的FEN编码、评估分数及人类选手的实际走法，该数据集不仅反映了高水平对弈的决策模式，更成为训练新一代棋类AI的关键语料库。

当前挑战

该数据集面临双重技术挑战：在领域问题层面，国际象棋评估本身具有极高复杂度，早期版本（2016年前）的将杀步数预测存在可靠性局限，且评估结果需持续应对不同Stockfish引擎版本间的算法差异；在数据构建过程中，分布式计算架构导致2016年12月、2020年7-8月等时段因系统间歇性故障产生大量异常数据，迫使研究者必须进行严格的数据清洗与时段剔除，这对保证评估结果的时空一致性提出了严峻考验。

常用场景

经典使用场景

在计算机博弈领域，fishnet-evals数据集为国际象棋引擎的评估能力提供了基准测试平台。该数据集通过整合Lichess平台上数百万真实对局位置及其Stockfish引擎的深度评估，成为研究棋局静态评估函数优化的黄金标准。研究人员可基于这些带有权威评分的棋局数据，验证新型搜索算法或评估函数的准确性。

解决学术问题

该数据集有效解决了博弈树搜索中静态评估的可靠性验证难题。通过提供标准化的人类对局位置与引擎评估对应关系，使研究者能够量化分析评估函数偏差问题。特别是其包含的残局评估数据，为研究国际象棋特定子局面的评估盲区提供了重要实验材料，推动了基于深度学习的评估函数改进工作。

衍生相关工作

基于该数据集衍生的经典研究包括《Stockfish评估偏差分析》等多项引擎优化工作。深度思维团队在开发AlphaZero过程中，曾将此数据集作为传统引擎评估的对照基准。近期发表的《神经网络评估函数迁移学习》论文中，该数据集被用作预训练模型的验证集，证明了其在机器学习领域的跨方法适用性。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集