five

austindavis/chess-gpt2-hiddenstates-512

收藏
Hugging Face2024-05-24 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/austindavis/chess-gpt2-hiddenstates-512
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为‘Dataset Card for Chess GPT-2 Hidden States 512’,主要用于棋类游戏(如国际象棋)的GPT-2隐藏状态分析,涉及机械可解释性研究。数据集大小在1M到10M之间,来源于lichess.org数据库。数据集包含多个配置,每个配置都有详细的特征描述,如层、位置、阶段、站点、棋局状态(FEN)和数据(序列化浮点数)。数据集主要用于训练,每个配置都有相应的训练数据大小和示例数量。

该数据集名为‘Dataset Card for Chess GPT-2 Hidden States 512’,主要用于棋类游戏(如国际象棋)的GPT-2隐藏状态分析,涉及机械可解释性研究。数据集大小在1M到10M之间,来源于lichess.org数据库。数据集包含多个配置,每个配置都有详细的特征描述,如层、位置、阶段、站点、棋局状态(FEN)和数据(序列化浮点数)。数据集主要用于训练,每个配置都有相应的训练数据大小和示例数量。
提供机构:
austindavis
原始信息汇总

数据集概述

基本信息

  • 数据集名称: Dataset Card for Chess GPT-2 Hidden States 512
  • 标签: chess, UCI, Lichess, Mechanistic Interpretability
  • 任务类别: other
  • 数据集大小: 1M<n<10M
  • 源数据集: database.lichess.org
  • Papers with Code ID: lichess_uci

数据集结构

  • 配置名称: 多个配置,如layer-00-phase-0, layer-00-phase-1等
  • 特征:
    • layer: int64
    • pos: int64
    • phase: int64
    • site: string
    • fen: string
    • data: sequence of float64

数据集拆分

  • 拆分: train
  • 示例:
    • 配置名称: layer-00-phase-0
      • 训练字节数: 503299537
      • 训练示例数: 120106
      • 下载大小: 210819025
      • 数据集大小: 503299537
    • 配置名称: layer-00-phase-1
      • 训练字节数: 757532934
      • 训练示例数: 180757
      • 下载大小: 341588559
      • 数据集大小: 757532934
    • 配置名称: layer-00-phase-2
      • 训练字节数: 503333294
      • 训练示例数: 120114
      • 下载大小: 207177958
      • 数据集大小: 503333294
    • 配置名称: layer-00-phase-3
      • 训练字节数: 732859594
      • 训练示例数: 174881
      • 下载大小: 334082178
      • 数据集大小: 732859594
    • 配置名称: layer-00-phase-4
      • 训练字节数: 19851800
      • 训练示例数: 4748
      • 下载大小: 3859630
      • 数据集大小: 19851800
    • 其他配置: 类似结构,详细信息略。

数据文件

  • 配置名称: 每个配置对应一组数据文件
  • 文件路径示例:
    • 配置名称: layer-00-phase-0
      • 拆分: train
      • 路径: layer-00-phase-0/train-*
    • 其他配置: 类似结构,详细信息略。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作