RoboCerebra
收藏RoboCerebra 数据集概述
数据集简介
RoboCerebra 是一个用于评估长时程机器人操作中高级推理能力的基准数据集。该数据集针对当前基准测试在时间尺度和结构复杂性方面的局限性,专注于探索系统2能力(以审慎、目标导向的思维为特征)。
主要组件
- 评估套件 (
evaluation/): 在 RoboCerebra 基准任务上进行模型评估 - 数据集构建器 (
rlds_dataset_builder/): 将 RoboCerebra 数据转换为 RLDS 格式用于训练
数据集获取
数据集可通过 Hugging Face Hub 下载: bash huggingface-cli download qiukingballball/RoboCerebraBench --repo-type dataset --local-dir ./RoboCerebra_Bench --resume-download
使用方式
基准测试使用 (LIBERO)
创建专用环境并安装 LIBERO 相关依赖进行基准测试。
OpenVLA 评估
配置 OpenVLA 评估环境,安装必要的依赖包和工具。
配置要求
使用前需要配置以下路径:
- 预训练模型检查点路径
- RoboCerebra 基准数据集路径
- WandB 实体和项目名称(如使用)
- Conda 环境路径(macOS 用户)
- LIBERO 安装目录路径
- 转换后的 HDF5 文件路径
快速开始
模型评估
bash cd evaluation/ python eval_openvla.py --task_types ["Ideal", "Random_Disturbance"]
数据集转换
将原始数据转换为 HDF5 格式,再转换为 RLDS 格式用于训练。
目录结构
RoboCerebra/ ├── LIBERO/ ├── evaluation/ │ ├── eval_openvla.py │ ├── config.py │ ├── robocerebra_logging.py │ ├── task_runner.py │ ├── episode.py │ ├── resume.py │ └── utils.py └── rlds_dataset_builder/ ├── regenerate_robocerebra_dataset.py └── RoboCerebraDataset/ └── RoboCerebraDataset_dataset_builder.py
引用信息
bibtex @article{han2025robocerebra, title={RoboCerebra: A Large-scale Benchmark for Long-horizon Robotic Manipulation Evaluation}, author={Han, Songhao and Qiu, Boxiang and Liao, Yue and Huang, Siyuan and Gao, Chen and Yan, Shuicheng and Liu, Si}, journal={arXiv preprint arXiv:2506.06677}, year={2025} }




