BlueSunflower/chess_games_base
收藏Hugging Face2023-05-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/BlueSunflower/chess_games_base
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含用于训练语言模型的国际象棋游戏数据。数据集由两部分组成:一部分是由Stockfish自对弈生成的262,000局游戏,另一部分是从lichess平台抽取的3.5M局游戏样本,这些游戏已经过滤掉未完成的游戏并转换为统一格式。每个压缩包内包含训练集和测试集两个文件:train.jsonl和test.jsonl。
提供机构:
BlueSunflower
原始信息汇总
国际象棋游戏数据集概述
数据集组成
- data_stockfish_262k.tar.gz:包含262,000场由Stockfish自我对弈生成的游戏数据。
- lichess.tar.gz:包含从lichess平台筛选出的350万场游戏样本,已过滤掉未完成的游戏,并统一转换为单一格式。
文件结构
每个压缩档案内包含以下两个文件:
- train.jsonl
- test.jsonl
许可证
本数据集遵循Apache-2.0许可证。



