computer-go-dataset
收藏github2024-05-22 更新2024-05-31 收录
下载链接:
https://github.com/yenw/computer-go-dataset
下载链接
链接失效反馈官方服务:
资源简介:
计算机围棋数据集,包含多个子数据集,如TYGEM、Tom、Foxwq等,涵盖了从2003年到2020年的围棋对局数据,用于计算机围棋研究和AI训练。
The Computer Go dataset comprises multiple sub-datasets, such as TYGEM, Tom, Foxwq, etc., encompassing Go game data from 2003 to 2020, utilized for computer Go research and AI training.
创建时间:
2017-04-12
原始信息汇总
数据集概述
1. TYGEM 数据集
- 时间范围: 2005.11.02 - 2016.12.31
- 游戏数量: 1,516,031 场
- 格式: 包含 id, date, white, black, result 等字段
- 转换工具: 提供转换为 SGF 的工具和使用示例
2. TOM 数据集
- 时间范围: 2003.09.25 - 2011.12.28
- 游戏数量: 50,956 场
- 格式: 包含 id, date, white, black, result 等字段
- 转换工具: 提供转换为 SGF 的工具和使用示例
3. Foxwq 数据集
- 时间范围: 2013.07.09 - 2019.10.17
- 游戏数量: 166,184 场
- Github 链接: 18k-9d
4. Ayas selfplay games for training value network
- 棋盘大小: 19x19, 13x13, 9x9
- 链接: Ayas selfplay games
5. Professional 数据集
- 时间范围: 1940.01.01 - 2017.01.09
- 游戏数量: 73,522 场
- 格式: 文本格式,包含多个 SGF 文件
- SGF 标签: 包含 GM, FF, SZ 等标签
6. AI 数据集
- 包含多个 AI 系统: AlphaGo, ELF OpenGo, FineArt, PhoenixGo 等
- 详细记录了各个 AI 系统的对局情况和比赛结果
7. CGOS 数据集
- 包含多个棋盘大小: 19x19, 13x13, 9x9
- 链接: CGOS 数据集
8. Leela Zero 数据集
- 包含自对局和比赛数据: Self-Play, Match
- 训练数据: Training Data
9. KGS 数据集
- 链接: Kifu
10. Minigo 数据集
- 包含多个资源: CloudyGo, Github, Youtube
- Google Cloud 存储: 包含训练数据和模型文件
11. NNGS 数据集
- 包含 SGF 文件数量: 435,495
- 时间范围: 1995.07 - 2005.05
- Github 链接: NNGS_SGF_Archive
12. ELF OpenGo 数据集
- 包含训练数据和分析: v2-training-run, Analysis
13. KataGo 数据集
- 包含分布式训练数据: KataGo Distributed Training
- 链接: Home Page, dataset
搜集汇总
数据集介绍

构建方式
在构建computer-go-dataset时,研究者们精心收集了多个来源的围棋对局数据,包括来自TYGEM、TOM、Foxwq等平台的对局记录,以及AI与人类专业棋手的对局数据。这些数据涵盖了从2003年至2020年的广泛时间段,确保了数据集的时间跨度和多样性。数据集的构建过程中,研究者们还特别关注了数据的格式统一,将不同来源的对局记录转换为标准的SGF格式,以便于后续的分析和使用。
使用方法
使用computer-go-dataset时,用户可以通过提供的转换工具将原始数据转换为SGF格式,以便进行进一步的分析和处理。数据集的README文件中详细描述了每个子数据集的格式和内容,用户可以根据需要选择特定的数据子集进行研究。此外,数据集还提供了多个转换脚本,如Converter.py和Converter_Tom.py,帮助用户快速将数据转换为可用的格式。对于AI研究者,该数据集可用于训练和验证围棋AI模型,提升模型的性能和泛化能力。
背景与挑战
背景概述
计算机围棋数据集(computer-go-dataset)汇集了多个来源的围棋对局数据,涵盖了从2003年至2020年的广泛时间跨度。该数据集由多个研究机构和独立研究人员共同构建,其中包括TYGEM、TOM、Foxwq等知名围棋平台的数据。这些数据不仅包括人类棋手之间的对局,还涵盖了AI与人类棋手以及AI之间的对局,如AlphaGo、ELF OpenGo等。这些数据对于研究围棋策略、AI算法优化以及人类与AI对弈的策略分析具有重要意义。
当前挑战
构建计算机围棋数据集面临多重挑战。首先,数据来源多样,格式各异,需要进行统一的标准化处理,如将不同格式的棋谱转换为SGF格式。其次,数据量庞大,处理和存储这些数据需要高效的算法和强大的计算资源。此外,数据的质量控制也是一个重要问题,确保每一场对局的准确性和完整性。最后,随着AI技术的快速发展,如何持续更新和扩充数据集,以反映最新的AI对弈策略和人类棋手的进步,也是一个持续的挑战。
常用场景
经典使用场景
在围棋领域,computer-go-dataset 数据集被广泛用于训练和评估计算机围棋程序。该数据集包含了从多个在线围棋平台收集的对局记录,涵盖了从专业棋手到AI程序的对局。这些对局数据不仅用于训练围棋AI的策略和估值网络,还用于研究围棋的复杂策略和模式识别。通过分析这些对局,研究人员可以深入理解围棋的战术和战略,从而提升AI的棋力。
解决学术问题
computer-go-dataset 数据集解决了围棋AI研究中的多个关键问题。首先,它提供了大量的高质量对局数据,使得研究人员能够训练出更强大的围棋AI模型。其次,通过对不同AI程序的对局分析,可以评估和比较不同AI的性能,推动围棋AI技术的发展。此外,该数据集还为研究围棋的复杂策略和模式识别提供了丰富的素材,有助于揭示围棋的深层规律。
实际应用
在实际应用中,computer-go-dataset 数据集被用于开发和优化围棋AI程序,这些程序可以应用于在线围棋平台、围棋教学软件以及围棋比赛分析工具。通过使用该数据集训练的AI,用户可以获得更智能的对手或教练,提升围棋水平。此外,这些AI程序还可以用于分析专业棋手的对局,提供战术建议和策略分析,帮助棋手提升棋力。
数据集最近研究
最新研究方向
在计算机围棋领域,computer-go-dataset数据集的最新研究方向主要集中在利用深度学习和强化学习技术提升围棋AI的性能。研究者们通过分析AlphaGo、AlphaGo Zero、ELF OpenGo等顶尖AI的对局数据,探索更高效的训练模型和策略网络。此外,数据集中的多维度信息,如不同棋手、不同平台和不同比赛的对局记录,为研究围棋AI的多样性和鲁棒性提供了丰富的资源。这些研究不仅推动了围棋AI的发展,也为其他复杂策略游戏的AI研究提供了宝贵的经验和方法。
以上内容由遇见数据集搜集并总结生成



