computer-go-dataset|计算机围棋数据集|围棋数据集数据集
收藏数据集概述
1. TYGEM 数据集
- 时间范围: 2005.11.02 - 2016.12.31
- 游戏数量: 1,516,031 场
- 格式:
- 索引文件: 包含id, date, white, black, result等字段
- 棋谱文件: 使用特定格式记录每一步棋
- 转换工具: 提供将棋谱转换为SGF格式的工具
2. TOM 数据集
- 时间范围: 2003.09.25 - 2011.12.28
- 游戏数量: 50,956 场
- 格式:
- 索引文件: 包含id, date, white, black, result等字段
- 棋谱文件: 使用特定格式记录每一步棋
- 转换工具: 提供将棋谱转换为SGF格式的工具
3. Foxwq 数据集
- 时间范围: 2013.07.09 - 2018.02.02
- 游戏数量: 148,102 场
4. Ayas selfplay games for training value network
- 棋盘大小: 19x19, 13x13, 9x9
5. Professional 数据集
- 时间范围: 1940.01.01 - 2017.01.09
- 游戏数量: 73,522 场
- 格式: 使用SGF格式
6. AI 数据集
- 包含的AI: AlphaGo, FineArt, Zen, CGI, DolBaram, Dancer, Leela, CNC
- 详细信息: 每个AI包含多个版本和比赛记录,详细记录了比赛时间、对手、胜负情况等
7. CGOS 数据集
- 棋盘大小: 19x19, 13x13, 9x9
8. Leela Zero 数据集
- 内容: 包含自对弈和比赛记录
9. KGS 数据集
- 内容: 提供SGF格式的棋谱
以上数据集涵盖了从2003年至2018年的围棋比赛记录,包括专业比赛和AI对弈,格式多样,支持从基础数据到高级分析的需求。

中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
Breast Ultrasound Images (BUSI)
小型(约500×500像素)超声图像,适用于良性和恶性病变的分类和分割任务。
github 收录
ISIC 2018
ISIC 2018数据集包含2594张皮肤病变图像,用于皮肤癌检测任务。数据集分为训练集、验证集和测试集,每张图像都附有详细的元数据,包括病变类型、患者年龄、性别和解剖部位等信息。
challenge2018.isic-archive.com 收录