jat-project/jat-dataset-tokenized|强化学习数据集|模仿学习数据集

hugging_face2023-12-22 更新2024-06-22 收录

强化学习

模仿学习

下载链接：

https://hf-mirror.com/datasets/jat-project/jat-dataset-tokenized

下载链接

链接失效反馈

资源简介：

该数据集包含多个Atari游戏的配置，每个配置详细记录了游戏的图像观察、奖励、离散动作、注意力掩码和损失权重等特征。数据集分为训练和测试两个部分，提供了每个部分的详细字节数和样本数。

提供机构：

jat-project

原始信息汇总

数据集概述

该数据集包含多个配置，每个配置对应不同的Atari游戏。以下是各配置的详细信息：

配置列表

atari-alien
- 特征：
  - image_observations: 多层序列，最终类型为float32
  - rewards: 序列，类型为float32
  - discrete_actions: 序列，类型为int64
  - attention_mask: 序列，类型为int8
  - loss_weight: 序列，类型为float32
- 分割：
  - train: 字节数为51686398456，样本数为14134
  - test: 字节数为5412188320，样本数为1480
- 下载大小：847071867字节
- 数据集大小：57098586776字节
atari-amidar
- 特征：
  - image_observations: 多层序列，最终类型为float32
  - rewards: 序列，类型为float32
  - discrete_actions: 序列，类型为int64
  - attention_mask: 序列，类型为int8
  - loss_weight: 序列，类型为float32
- 分割：
  - train: 字节数为52362921996，样本数为14319
  - test: 字节数为4808802460，样本数为1315
- 下载大小：645217608字节
- 数据集大小：57171724456字节
atari-assault
- 特征：
  - image_observations: 多层序列，最终类型为float32
  - rewards: 序列，类型为float32
  - discrete_actions: 序列，类型为int64
  - attention_mask: 序列，类型为int8
  - loss_weight: 序列，类型为float32
- 分割：
  - train: 字节数为52757865468，样本数为14427
  - test: 字节数为4421172756，样本数为1209
- 下载大小：253415283字节
- 数据集大小：57179038224字节
atari-asterix
- 特征：
  - image_observations: 多层序列，最终类型为float32
  - rewards: 序列，类型为float32
  - discrete_actions: 序列，类型为int64
  - attention_mask: 序列，类型为int8
  - loss_weight: 序列，类型为float32
- 分割：
  - train: 字节数为52863915104，样本数为14456
  - test: 字节数为5137922020，样本数为1405
- 下载大小：293282697字节
- 数据集大小：58001837124字节
atari-asteroids
- 特征：
  - image_observations: 多层序列，最终类型为float32
  - rewards: 序列，类型为float32
  - discrete_actions: 序列，类型为int64
  - attention_mask: 序列，类型为int8
  - loss_weight: 序列，类型为float32
- 分割：
  - train: 字节数为52468971632，样本数为14348
  - test: 字节数为3605687624，样本数为986
- 下载大小：316908651字节
- 数据集大小：56074659256字节
atari-atlantis
- 特征：
  - image_observations: 多层序列，最终类型为float32
  - rewards: 序列，类型为float32
  - discrete_actions: 序列，类型为int64
  - attention_mask: 序列，类型为int8
  - loss_weight: 序列，类型为float32
- 分割：
  - train: 字节数为52384863300，样本数为14325
  - test: 字节数为3975032908，样本数为1087
- 下载大小：274032418字节
- 数据集大小：56359896208字节
atari-bankheist
- 特征：
  - image_observations: 多层序列，最终类型为float32
  - rewards: 序列，类型为float32
  - discrete_actions: 序列，类型为int64
  - attention_mask: 序列，类型为int8
  - loss_weight: 序列，类型为float32
- 分割：
  - train: 字节数为51807075628，样本数为14167
  - test: 字节数为5836386864，样本数为1596
- 下载大小：879900687字节
- 数据集大小：57643462492字节
atari-battlezone
- 特征：
  - image_observations: 多层序列，最终类型为float32
  - rewards: 序列，类型为float32
  - discrete_actions: 序列，类型为int64
  - attention_mask: 序列，类型为int8
  - loss_weight: 序列，类型为float32
- 分割：
  - train: 字节数为51126895204，样本数为13981
  - test: 字节数为6092368744，样本数为1666
- 下载大小：530266996字节
- 数据集大小：57219263948字节
atari-beamrider
- 特征：
  - image_observations: 多层序列，最终类型为float32
  - rewards: 序列，类型为float32
  - discrete_actions: 序列，类型为int64
  - attention_mask: 序列，类型为int8
  - loss_weight: 序列，类型为float32
- 分割：
  - train: 字节数为49155834728，样本数为13442
  - test: 字节数为7880585020，样本数为2155
- 下载大小：427025312字节
- 数据集大小：57036419748字节
atari-berzerk
- 特征：
  - image_observations: 多层序列，最终类型为float32
  - rewards: 序列，类型为float32
  - discrete_actions: 序列，类型为int64
  - attention_mask: 序列，类型为int8
  - loss_weight: 序列，类型为float32
- 分割：
  - train: 字节数为49492268056，样本数为13534
  - test: 字节数为6172820192，样本数为1688
- 下载大小：351445377字节
- 数据集大小：55665088248字节
atari-bowling
- 特征：
  - image_observations: 多层序列，最终类型为float32
  - rewards: 序列，类型为float32
  - discrete_actions: 序列，类型为int64
  - attention_mask: 序列，类型为int8
  - loss_weight: 序列，类型为float32
- 分割：
  - train: 字节数为51598633240，样本数为14110
  - test: 字节数为5898553892，样本数为1613
- 下载大小：163624131字节
- 数据集大小：57497187132字节
atari-boxing
- 特征：
  - image_observations: 多层序列，最终类型为float32
  - rewards: 序列，类型为float32
  - discrete_actions: 序列，类型为int64
  - attention_mask: 序列，类型为int8
  - loss_weight: 序列，类型为float32
- 分割：
  - train: 字节数为53178407128，样本数为14542
  - test: 字节数为5883926356，样本数为1609
- 下载大小：662704435字节
- 数据集大小：59062333484字节
atari-breakout
- 特征：
  - image_observations: 多层序列，最终类型为float32
  - rewards: 序列，类型为float32
  - discrete_actions: 序列，类型为int64
  - attention_mask: 序列，类型为int8
  - loss_weight: 序列，类型为float32
- 分割：
  - train: 字节数为49272855016，样本数为13474
  - test: 字节数为6611646272，样本数为1808
- 下载大小：265049647字节
- 数据集大小：55884501288字节
atari-centipede
- 特征：
  - image_observations: 多层序列，最终类型为float32
  - rewards: 序列，类型为float32
  - discrete_actions: 序列，类型为int64
  - attention_mask: 序列，类型为int8
  - loss_weight: 序列，类型为float32
- 分割：
  - train: 字节数为51913125264，样本数为14196
  - test: 字节数为6026544832，样本数为1648
- 下载大小：269104472字节
- 数据集大小：57939670096字节
atari-choppercommand
- 特征：
  - image_observations: 多层序列，最终类型为float32
  - rewards: 序列，类型为float32
  - discrete_actions: 序列，类型为int64
  - attention_mask: 序列，类型为int8
  - loss_weight: 序列，类型为float32
- 分割：
  - train: 字节数为48991274948，样本数为13397
  - test: 字节数为7156521988，样本数为1957
- 下载大小：425086559字节
- 数据集大小：56147796936字节
atari-crazyclimber
- 特征：
  - image_observations: 多层序列，最终类型为float32
  - rewards: 序列，类型为float32
  - discrete_actions: 序列，类型为int64
  - attention_mask: 序列，类型为int8
  - loss_weight: 序列，类型为float32
- 分割：
  - train: 字节数为51291454984，样本数为14026
  - test: 字节数为5712052808，样本数为1562
- 下载大小：458314909字节
- 数据集大小：57003507792字节
atari-defender
- 特征：
  - image_observations: 多层序列，最终类型为float32
  - rewards: 序列，类型为float32
  - discrete_actions: 序列，类型为int64
  - attention_mask: 序列，类型为int8
  - loss_weight: 序列，类型为float32
- 分割：
  - train: 字节数为49382561536，样本数为13504
  - test: 字节数为6172820192，样本数为1688
- 下载大小：217534779字节
- 数据集大小：55555381728字节
atari-demonattack
- 特征：
  - image_observations: 多层序列，最终类型为float32
  - rewards: 序列，类型为float32
  - discrete_actions: 序列，类型为int64
  - attention_mask: 序列，类型为int8
  - loss_weight: 序列，类型为float32
- 分割：
  - train: 字节数为49364277116，样本数为13499
  - test: 字节数为6172820192，样本数为1688
- 下载大小：209141226字节
- 数据集大小：55537097308字节
atari-doubledunk
- 特征：
  - image_observations: 多层序列，最终类型为float32
  - rewards: 序列，类型为float32
  - discrete_actions: 序列，类型为int64
  - attention_mask: 序列，类型为int8
  - loss_weight: 序列，类型为float32
- 分割：
  - train: 字节数为52264186128，样本数为14292
  - test: 字节数为5799818024，样本数为1586
- 下载大小：585265286字节
- 数据集大小：58064004152字节
atari-enduro

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

GME Data

关于2021年GameStop股票活动的数据，包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录

flames-and-smoke-datasets

该仓库总结了多个公开的火焰和烟雾数据集，包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述，包括数据来源、图像数量、标注信息等。

github 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集，该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术（如分类、编码和二值化）来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

MedChain

MedChain是由香港城市大学、香港中文大学、深圳大学、阳明交通大学和台北荣民总医院联合创建的临床决策数据集，包含12,163个临床案例，涵盖19个医学专科和156个子类别。数据集通过五个关键阶段模拟临床工作流程，强调个性化、互动性和顺序性。数据来源于中国医疗网站“iiYi”，经过专业医生验证和去识别化处理，确保数据质量和患者隐私。MedChain旨在评估大型语言模型在真实临床场景中的诊断能力，解决现有基准在个性化医疗、互动咨询和顺序决策方面的不足。

arXiv 收录

Traditional-Chinese-Medicine-Dataset-SFT

该数据集是一个高质量的中医数据集，主要由非网络来源的内部数据构成，包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容，质量优异，信息密度可观。数据集适用于预训练或继续预训练用途，未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用，但建议先使用配套的预训练数据集对模型进行继续预训练后，再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据，以避免灾难性遗忘并加强模型表现。

huggingface 收录