jat-project/jat-dataset-tokenized|强化学习数据集|模仿学习数据集
收藏数据集概述
该数据集包含多个配置,每个配置对应不同的Atari游戏。以下是各配置的详细信息:
配置列表
-
atari-alien
- 特征:
image_observations
: 多层序列,最终类型为float32
rewards
: 序列,类型为float32
discrete_actions
: 序列,类型为int64
attention_mask
: 序列,类型为int8
loss_weight
: 序列,类型为float32
- 分割:
train
: 字节数为51686398456,样本数为14134test
: 字节数为5412188320,样本数为1480
- 下载大小:847071867字节
- 数据集大小:57098586776字节
- 特征:
-
atari-amidar
- 特征:
image_observations
: 多层序列,最终类型为float32
rewards
: 序列,类型为float32
discrete_actions
: 序列,类型为int64
attention_mask
: 序列,类型为int8
loss_weight
: 序列,类型为float32
- 分割:
train
: 字节数为52362921996,样本数为14319test
: 字节数为4808802460,样本数为1315
- 下载大小:645217608字节
- 数据集大小:57171724456字节
- 特征:
-
atari-assault
- 特征:
image_observations
: 多层序列,最终类型为float32
rewards
: 序列,类型为float32
discrete_actions
: 序列,类型为int64
attention_mask
: 序列,类型为int8
loss_weight
: 序列,类型为float32
- 分割:
train
: 字节数为52757865468,样本数为14427test
: 字节数为4421172756,样本数为1209
- 下载大小:253415283字节
- 数据集大小:57179038224字节
- 特征:
-
atari-asterix
- 特征:
image_observations
: 多层序列,最终类型为float32
rewards
: 序列,类型为float32
discrete_actions
: 序列,类型为int64
attention_mask
: 序列,类型为int8
loss_weight
: 序列,类型为float32
- 分割:
train
: 字节数为52863915104,样本数为14456test
: 字节数为5137922020,样本数为1405
- 下载大小:293282697字节
- 数据集大小:58001837124字节
- 特征:
-
atari-asteroids
- 特征:
image_observations
: 多层序列,最终类型为float32
rewards
: 序列,类型为float32
discrete_actions
: 序列,类型为int64
attention_mask
: 序列,类型为int8
loss_weight
: 序列,类型为float32
- 分割:
train
: 字节数为52468971632,样本数为14348test
: 字节数为3605687624,样本数为986
- 下载大小:316908651字节
- 数据集大小:56074659256字节
- 特征:
-
atari-atlantis
- 特征:
image_observations
: 多层序列,最终类型为float32
rewards
: 序列,类型为float32
discrete_actions
: 序列,类型为int64
attention_mask
: 序列,类型为int8
loss_weight
: 序列,类型为float32
- 分割:
train
: 字节数为52384863300,样本数为14325test
: 字节数为3975032908,样本数为1087
- 下载大小:274032418字节
- 数据集大小:56359896208字节
- 特征:
-
atari-bankheist
- 特征:
image_observations
: 多层序列,最终类型为float32
rewards
: 序列,类型为float32
discrete_actions
: 序列,类型为int64
attention_mask
: 序列,类型为int8
loss_weight
: 序列,类型为float32
- 分割:
train
: 字节数为51807075628,样本数为14167test
: 字节数为5836386864,样本数为1596
- 下载大小:879900687字节
- 数据集大小:57643462492字节
- 特征:
-
atari-battlezone
- 特征:
image_observations
: 多层序列,最终类型为float32
rewards
: 序列,类型为float32
discrete_actions
: 序列,类型为int64
attention_mask
: 序列,类型为int8
loss_weight
: 序列,类型为float32
- 分割:
train
: 字节数为51126895204,样本数为13981test
: 字节数为6092368744,样本数为1666
- 下载大小:530266996字节
- 数据集大小:57219263948字节
- 特征:
-
atari-beamrider
- 特征:
image_observations
: 多层序列,最终类型为float32
rewards
: 序列,类型为float32
discrete_actions
: 序列,类型为int64
attention_mask
: 序列,类型为int8
loss_weight
: 序列,类型为float32
- 分割:
train
: 字节数为49155834728,样本数为13442test
: 字节数为7880585020,样本数为2155
- 下载大小:427025312字节
- 数据集大小:57036419748字节
- 特征:
-
atari-berzerk
- 特征:
image_observations
: 多层序列,最终类型为float32
rewards
: 序列,类型为float32
discrete_actions
: 序列,类型为int64
attention_mask
: 序列,类型为int8
loss_weight
: 序列,类型为float32
- 分割:
train
: 字节数为49492268056,样本数为13534test
: 字节数为6172820192,样本数为1688
- 下载大小:351445377字节
- 数据集大小:55665088248字节
- 特征:
-
atari-bowling
- 特征:
image_observations
: 多层序列,最终类型为float32
rewards
: 序列,类型为float32
discrete_actions
: 序列,类型为int64
attention_mask
: 序列,类型为int8
loss_weight
: 序列,类型为float32
- 分割:
train
: 字节数为51598633240,样本数为14110test
: 字节数为5898553892,样本数为1613
- 下载大小:163624131字节
- 数据集大小:57497187132字节
- 特征:
-
atari-boxing
- 特征:
image_observations
: 多层序列,最终类型为float32
rewards
: 序列,类型为float32
discrete_actions
: 序列,类型为int64
attention_mask
: 序列,类型为int8
loss_weight
: 序列,类型为float32
- 分割:
train
: 字节数为53178407128,样本数为14542test
: 字节数为5883926356,样本数为1609
- 下载大小:662704435字节
- 数据集大小:59062333484字节
- 特征:
-
atari-breakout
- 特征:
image_observations
: 多层序列,最终类型为float32
rewards
: 序列,类型为float32
discrete_actions
: 序列,类型为int64
attention_mask
: 序列,类型为int8
loss_weight
: 序列,类型为float32
- 分割:
train
: 字节数为49272855016,样本数为13474test
: 字节数为6611646272,样本数为1808
- 下载大小:265049647字节
- 数据集大小:55884501288字节
- 特征:
-
atari-centipede
- 特征:
image_observations
: 多层序列,最终类型为float32
rewards
: 序列,类型为float32
discrete_actions
: 序列,类型为int64
attention_mask
: 序列,类型为int8
loss_weight
: 序列,类型为float32
- 分割:
train
: 字节数为51913125264,样本数为14196test
: 字节数为6026544832,样本数为1648
- 下载大小:269104472字节
- 数据集大小:57939670096字节
- 特征:
-
atari-choppercommand
- 特征:
image_observations
: 多层序列,最终类型为float32
rewards
: 序列,类型为float32
discrete_actions
: 序列,类型为int64
attention_mask
: 序列,类型为int8
loss_weight
: 序列,类型为float32
- 分割:
train
: 字节数为48991274948,样本数为13397test
: 字节数为7156521988,样本数为1957
- 下载大小:425086559字节
- 数据集大小:56147796936字节
- 特征:
-
atari-crazyclimber
- 特征:
image_observations
: 多层序列,最终类型为float32
rewards
: 序列,类型为float32
discrete_actions
: 序列,类型为int64
attention_mask
: 序列,类型为int8
loss_weight
: 序列,类型为float32
- 分割:
train
: 字节数为51291454984,样本数为14026test
: 字节数为5712052808,样本数为1562
- 下载大小:458314909字节
- 数据集大小:57003507792字节
- 特征:
-
atari-defender
- 特征:
image_observations
: 多层序列,最终类型为float32
rewards
: 序列,类型为float32
discrete_actions
: 序列,类型为int64
attention_mask
: 序列,类型为int8
loss_weight
: 序列,类型为float32
- 分割:
train
: 字节数为49382561536,样本数为13504test
: 字节数为6172820192,样本数为1688
- 下载大小:217534779字节
- 数据集大小:55555381728字节
- 特征:
-
atari-demonattack
- 特征:
image_observations
: 多层序列,最终类型为float32
rewards
: 序列,类型为float32
discrete_actions
: 序列,类型为int64
attention_mask
: 序列,类型为int8
loss_weight
: 序列,类型为float32
- 分割:
train
: 字节数为49364277116,样本数为13499test
: 字节数为6172820192,样本数为1688
- 下载大小:209141226字节
- 数据集大小:55537097308字节
- 特征:
-
atari-doubledunk
- 特征:
image_observations
: 多层序列,最终类型为float32
rewards
: 序列,类型为float32
discrete_actions
: 序列,类型为int64
attention_mask
: 序列,类型为int8
loss_weight
: 序列,类型为float32
- 分割:
train
: 字节数为52264186128,样本数为14292test
: 字节数为5799818024,样本数为1586
- 下载大小:585265286字节
- 数据集大小:58064004152字节
- 特征:
-
atari-enduro
GME Data
关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。
github 收录
flames-and-smoke-datasets
该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。
github 收录
Breast Cancer Dataset
该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。
github 收录
MedChain
MedChain是由香港城市大学、香港中文大学、深圳大学、阳明交通大学和台北荣民总医院联合创建的临床决策数据集,包含12,163个临床案例,涵盖19个医学专科和156个子类别。数据集通过五个关键阶段模拟临床工作流程,强调个性化、互动性和顺序性。数据来源于中国医疗网站“iiYi”,经过专业医生验证和去识别化处理,确保数据质量和患者隐私。MedChain旨在评估大型语言模型在真实临床场景中的诊断能力,解决现有基准在个性化医疗、互动咨询和顺序决策方面的不足。
arXiv 收录
Traditional-Chinese-Medicine-Dataset-SFT
该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。
huggingface 收录