HumanCompatibleAI/ppo-seals-Walker2d-v1

Name: HumanCompatibleAI/ppo-seals-Walker2d-v1
Creator: HumanCompatibleAI
Published: 2023-09-27 07:09:25
License: 暂无描述

Hugging Face2023-09-27 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/HumanCompatibleAI/ppo-seals-Walker2d-v1

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: obs sequence: sequence: float64 - name: acts sequence: sequence: float32 - name: infos sequence: string - name: terminal dtype: bool - name: rews sequence: float32 splits: - name: train num_bytes: 63405655 num_examples: 104 download_size: 20942934 dataset_size: 63405655 --- # Dataset Card for "ppo-seals-Walker2d-v1" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

HumanCompatibleAI

原始信息汇总

数据集卡片 "ppo-seals-Walker2d-v1"

数据集信息

特征

obs: 序列类型，数据类型为 float64
acts: 序列类型，数据类型为 float32
infos: 序列类型，数据类型为 string
terminal: 数据类型为 bool
rews: 序列类型，数据类型为 float32

分割

train:
- 字节数: 63405655
- 样本数: 104

大小

下载大小: 20942934 字节
数据集大小: 63405655 字节

搜集汇总

数据集介绍

背景与挑战

背景概述

该数据集是HumanCompatibleAI发布的强化学习数据集，包含104行数据，用于Walker2d环境中的PPO（近端策略优化）算法训练。数据以序列形式存储观察、动作、信息和奖励等关键字段，格式为parquet，适用于文本和时间序列分析。数据集规模较小，主要用于AI模型的训练和评估。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集