five

computer-go-dataset|计算机围棋数据集|围棋数据集数据集

收藏
github2019-03-06 更新2024-05-31 收录
计算机围棋
围棋数据集
下载链接:
https://github.com/xcaostagit/computer-go-dataset
下载链接
链接失效反馈
资源简介:
包含多个围棋相关的数据集,用于计算机围棋研究和训练,包括TYGEM、Tom、Foxwq、Aya、Professional、AI、CGOS、LeelaZero和KGS等数据集。

本数据集集成了多个与围棋相关的数据集,旨在为计算机围棋的研究与训练提供支持,涵盖TYGEM、Tom、Foxwq、Aya、专业、人工智能、CGOS、LeelaZero以及KGS等系列数据集。
创建时间:
2018-02-24
原始信息汇总

数据集概述

1. TYGEM 数据集

  • 时间范围: 2005.11.02 - 2016.12.31
  • 游戏数量: 1,516,031 场
  • 格式:
    • 索引文件: 包含id, date, white, black, result等字段
    • 棋谱文件: 使用特定格式记录每一步棋
    • 转换工具: 提供将棋谱转换为SGF格式的工具

2. TOM 数据集

  • 时间范围: 2003.09.25 - 2011.12.28
  • 游戏数量: 50,956 场
  • 格式:
    • 索引文件: 包含id, date, white, black, result等字段
    • 棋谱文件: 使用特定格式记录每一步棋
    • 转换工具: 提供将棋谱转换为SGF格式的工具

3. Foxwq 数据集

  • 时间范围: 2013.07.09 - 2018.02.02
  • 游戏数量: 148,102 场

4. Ayas selfplay games for training value network

  • 棋盘大小: 19x19, 13x13, 9x9

5. Professional 数据集

  • 时间范围: 1940.01.01 - 2017.01.09
  • 游戏数量: 73,522 场
  • 格式: 使用SGF格式

6. AI 数据集

  • 包含的AI: AlphaGo, FineArt, Zen, CGI, DolBaram, Dancer, Leela, CNC
  • 详细信息: 每个AI包含多个版本和比赛记录,详细记录了比赛时间、对手、胜负情况等

7. CGOS 数据集

  • 棋盘大小: 19x19, 13x13, 9x9

8. Leela Zero 数据集

  • 内容: 包含自对弈和比赛记录

9. KGS 数据集

  • 内容: 提供SGF格式的棋谱

以上数据集涵盖了从2003年至2018年的围棋比赛记录,包括专业比赛和AI对弈,格式多样,支持从基础数据到高级分析的需求。

AI搜集汇总
数据集介绍
main_image_url
构建方式
本数据集通过收集并整合多个来源的围棋对局信息构建而成,涵盖了从2003年至2018年间不同等级选手的对局记录,其中包括了专业选手和业余选手的对局数据。数据集以索引文件和棋谱文件的形式存储,索引文件记录了对局的基本信息,如对局日期、选手信息、比赛结果等,而棋谱文件则详细记录了每一步的走棋坐标。
使用方法
使用该数据集时,用户可以根据需要选择不同的数据子集。首先,用户需要将索引文件和棋谱文件放置在相应的文件夹中,然后使用提供的转换工具将索引文件转换为SGF格式,以便于在围棋软件中进一步分析和研究。转换工具的使用方法已在数据集的README文件中详细说明。
背景与挑战
背景概述
computer-go-dataset 数据集汇集了多个时期和来源的围棋对局数据,旨在为围棋的人工智能研究提供丰富的学习材料。该数据集包含了从2003年至2018年间多个围棋高手的对局记录,以及人工智能程序的对局数据。其中包括了TYGEM、TOM、Foxwq等多个数据子集,以及专业棋手的对局和人工智能如AlphaGo的对局记录。该数据集的创建,为围棋领域的研究提供了宝贵的数据资源,对推动围棋AI技术的发展起到了重要作用。
当前挑战
在构建computer-go-dataset数据集的过程中,研究者面临了多个挑战。首先,数据集的多样性和大规模特性要求在数据收集和整合过程中确保数据的准确性和一致性。其次,不同来源的数据格式不一,需要开发相应的转换工具来统一格式,以便于后续的处理和分析。此外,数据集在应用于机器学习模型训练时,如何处理和平衡数据集中的胜率偏差、棋手水平差异等也是研究过程中需要考虑的重要问题。
常用场景
经典使用场景
computer-go-dataset数据集作为计算机围棋领域的重要资源,其经典使用场景主要在于为机器学习模型提供训练数据,特别是深度学习模型。该数据集包含了大量的围棋对局记录,能够帮助模型学习围棋策略和决策模式。
解决学术问题
该数据集解决了围棋AI研究中数据稀缺的问题,为学术研究提供了丰富的数据基础。通过分析这些数据,研究者能够探究围棋的高级策略,提高AI的棋力水平,并推动围棋算法的发展。
实际应用
在实际应用中,computer-go-dataset数据集被用于开发围棋AI程序,这些程序不仅能在围棋比赛中与人类棋手对弈,还能在围棋教学和在线对弈平台中发挥重要作用,提升围棋爱好者的游戏体验。
数据集最近研究
最新研究方向
近期,计算机围棋领域的研究聚焦于利用先进的人工智能算法进行自我学习和对战模拟,以提升围棋AI的竞技水平。以computer-go-dataset数据集为例,其中的AlphaGo、FineArt、Zen等子数据集记录了多种AI在不同时间段的表现,以及它们与人类顶尖选手的对局。这些数据集为研究AI的自我学习能力、策略优化以及对抗性策略的制定提供了丰富的素材。特别是AlphaGo Zero的83场比赛数据,展示了从零开始学习并在短时间内达到超越人类顶尖水平的可能性,对深度学习和强化学习在围棋领域的应用研究具有重要的参考价值。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

CatMeows

该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。

huggingface 收录

Breast Ultrasound Images (BUSI)

小型(约500×500像素)超声图像,适用于良性和恶性病变的分类和分割任务。

github 收录

ISIC 2018

ISIC 2018数据集包含2594张皮肤病变图像,用于皮肤癌检测任务。数据集分为训练集、验证集和测试集,每张图像都附有详细的元数据,包括病变类型、患者年龄、性别和解剖部位等信息。

challenge2018.isic-archive.com 收录