edbeeching/gia-dataset-tokenized-2024-2
收藏Hugging Face2023-09-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/edbeeching/gia-dataset-tokenized-2024-2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个Atari游戏的配置,每个配置包含了一系列特征,如patches(图像块)、loss_mask(损失掩码)、patch_positions(图像块位置)、input_ids(输入ID)、input_types(输入类型)、local_positions(局部位置)和attention_mask(注意力掩码)。数据集分为训练集和测试集,并提供了每个分割的字节数和样本数。此外,还提供了每个配置的下载大小和数据集大小。
提供机构:
edbeeching
原始信息汇总
数据集概述
数据集配置
atari-alien
- 特征:
patches: 多层序列,最终类型为uint8loss_mask: 序列,类型为boolpatch_positions: 多层序列,最终类型为float64input_ids: 序列,类型为int32input_types: 序列,类型为int64local_positions: 序列,类型为int64attention_mask: 序列,类型为bool
- 分割:
test: 字节数2427492496, 样本数1836
- 下载大小:
197411801 - 数据集大小:
2427492496
atari-amidar
- 特征:
loss_mask: 序列,类型为boollocal_positions: 序列,类型为int64patches: 多层序列,最终类型为uint8patch_positions: 多层序列,最终类型为float64input_ids: 序列,类型为int32input_types: 序列,类型为int64attention_mask: 序列,类型为bool
- 分割:
train: 字节数23292403388, 样本数17641test: 字节数2157941388, 样本数1637
- 下载大小:
1619960876 - 数据集大小:
25450344776
atari-assault
- 特征:
loss_mask: 序列,类型为boollocal_positions: 序列,类型为int64patches: 多层序列,最终类型为uint8patch_positions: 多层序列,最终类型为float64input_ids: 序列,类型为int32input_types: 序列,类型为int64attention_mask: 序列,类型为bool
- 分割:
train: 字节数23077576568, 样本数17434test: 字节数1898092400, 样本数1436
- 下载大小:
760479036 - 数据集大小:
24975668968
atari-asterix
- 特征:
local_positions: 序列,类型为int64patch_positions: 多层序列,最终类型为float64input_types: 序列,类型为int64input_ids: 序列,类型为int32loss_mask: 序列,类型为boolpatches: 多层序列,最终类型为uint8attention_mask: 序列,类型为bool
- 分割:
train: 字节数25094377660, 样本数19161
- 下载大小:
943683526 - 数据集大小:
25094377660
atari-asteroids
- 特征:
local_positions: 序列,类型为int64patch_positions: 多层序列,最终类型为float64input_types: 序列,类型为int64input_ids: 序列,类型为int32loss_mask: 序列,类型为boolpatches: 多层序列,最终类型为uint8attention_mask: 序列,类型为bool
- 分割:
train: 字节数22677165856, 样本数17112
- 下载大小:
807221186 - 数据集大小:
22677165856
atari-atlantis
- 特征:
local_positions: 序列,类型为int64patch_positions: 多层序列,最终类型为float64input_types: 序列,类型为int64input_ids: 序列,类型为int32loss_mask: 序列,类型为boolpatches: 多层序列,最终类型为uint8attention_mask: 序列,类型为bool
- 分割:
train: 字节数22825149408, 样本数17240
- 下载大小:
745609354 - 数据集大小:
22825149408
atari-bankheist
- 特征:
input_types: 序列,类型为int64local_positions: 序列,类型为int64patch_positions: 多层序列,最终类型为float64patches: 多层序列,最终类型为uint8input_ids: 序列,类型为int32loss_mask: 序列,类型为boolattention_mask: 序列,类型为bool
- 分割:
train: 字节数23741888116, 样本数18043test: 字节数2701097304, 样本数2050
- 下载大小:
2847993069 - 数据集大小:
26442985420
atari-battlezone
- 特征:
patches: 多层序列,最终类型为uint8local_positions: 序列,类型为int64loss_mask: 序列,类型为boolinput_types: 序列,类型为int64patch_positions: 多层序列,最终类型为float64input_ids: 序列,类型为int32attention_mask: 序列,类型为bool
- 分割:
test: 字节数2683381416, 样本数2030
- 下载大小:
162167846 - 数据集大小:
2683381416
atari-berzerk
- 特征:
patches: 多层序列,最终类型为uint8loss_mask: 序列,类型为boollocal_positions: 序列,类型为int64patch_positions: 多层序列,最终类型为float64input_types: 序列,类型为int64input_ids: 序列,类型为int32attention_mask: 序列,类型为bool
- 分割:
test: 字节数2683232284, 样本数2025
- 下载大小:
98071291 - 数据集大小:
2683232284
atari-bowling
- 特征:
patches: 多层序列,最终类型为uint8loss_mask: 序列,类型为boollocal_positions: 序列,类型为int64patch_positions: 多层序列,最终类型为float64input_types: 序列,类型为int64input_ids: 序列,类型为int32attention_mask: 序列,类型为bool
- 分割:
test: 字节数2638612892, 样本数2001
- 下载大小:
57099861 - 数据集大小:
2638612892
atari-boxing
- 特征:
patches: 多层序列,最终类型为uint8loss_mask: 序列,类型为boollocal_positions: 序列,类型为int64patch_positions: 多层序列,最终类型为float64input_types: 序列,类型为int64input_ids: 序列,类型为int32attention_mask: 序列,类型为bool
- 分割:
test: 字节数2925635312, 样本数2252
- 下载大小:
154591181 - 数据集大小:
2925635312
atari-breakout
- 特征:
loss_mask: 序列,类型为boolpatch_positions: 多层序列,最终类型为float64patches: 多层序列,最终类型为uint8input_types: 序列,类型为int64input_ids: 序列,类型为int32local_positions: 序列,类型为int64attention_mask: 序列,类型为bool
- 分割:
train: 字节数21372025124, 样本数16135test: 字节数2843462328, 样本数2146
- 下载大小:
740521401 - 数据集大小:
24215487452
atari-centipede
- 特征:
loss_mask: 序列,类型为boolpatch_positions: 多层序列,最终类型为float64patches: 多层序列,最终类型为uint8input_types: 序列,类型为int64input_ids: 序列,类型为int32local_positions: 序列,类型为int64attention_mask: 序列,类型为bool
- 分割:
train: 字节数24525541956, 样本数18727test: 字节数2743854332, 样本数2097
- 下载大小:
886355860 - 数据集大小:
27269396288
atari-choppercommand
- 特征:
loss_mask: 序列,类型为boolpatch_positions: 多层序列,最终类型为float64patches: 多层序列,最终类型为uint8input_types: 序列,类型为int64input_ids: 序列,类型为int32local_positions: 序列,类型为int64attention_mask: 序列,类型为bool
- 分割:
train: 字节数21916144968, 样本数16598test: 字节数3130204472, 样本数2370
- 下载大小:
1120222280 - 数据集大小:
25046349440
atari-crazyclimber
- 特征:
input_types: 序列,类型为int64loss_mask: 序列,类型为boolpatches: 多层序列,最终类型为uint8patch_positions: 多层序列,最终类型为float64local_positions: 序列,类型为int64input_ids: 序列,类型为int32attention_mask: 序列,类型为bool
- 分割:
test: 字节数2452295076, 样本数1855
- 下载大小:
147409815 - 数据集大小:
2452295076
atari-defender
- 特征:
input_types: 序列,类型为int64loss_mask: 序列,类型为boolpatches: 多层序列,最终类型为uint8patch_positions: 多层序列,最终类型为float64local_positions: 序列,类型为int64input_ids: 序列,类型为int32attention_mask: 序列,类型为bool
- 分割:
test: 字节数2667101644, 样本数2013
- 下载大小:
76162534 - 数据集大小:
2667101644
atari-demonattack
- 特征:
input_types: 序列,类型为int64loss_mask: 序列,类型为boolpatches: 多层序列,最终类型为uint8patch_positions: 多层序列,最终类型为float64local_positions: 序列,类型为int64input_ids: 序列,类型为int32attention_mask: 序列,类型为bool
- 分割:
test: 字节数2655965584, 样本数2004
- 下载大小:
71540075 - 数据集大小:
2655965584
atari-doubledunk
- 特征:
patches: 多层序列,最终类型为uint8local_positions: 序列,类型为int64input_ids: 序列,类型为int32input_types: 序列,类型为int64loss_mask: 序列,类型为boolpatch_positions: 多层序列,最终类型为float64attention_mask: 序列,类型为bool
- 分割:
test: 字节数2654251456, 样本数2032
- 下载大小:
140407266 - 数据集大小:
2654251456
atari-fishingderby
- 特征:
patches: 多层序列,最终类型为uint8local_positions: 序列,类型为int64input_ids: 序列,类型为int32input_types: 序列,类型为



