ManiSoft
收藏数据集概述:ManiSoft
ManiSoft 是一个面向软体机器人操作的视觉-语言-动作(VLA)学习数据集与基准测试平台,专注于软体机器人的操控任务与模仿学习。
数据集规模与许可
- 语言:英语
- 规模:1,000 至 10,000 个样本
- 许可协议:MIT
- 任务类别:机器人学
- 标签:机器人学、软体机器人、操作、模仿学习、视觉-语言-动作、具身智能、仿真
任务类型
数据集包含四种操作任务的专家演示:
- COLL:收集
- ALN:对齐
- ARR:排列
- STK:堆叠
数据集结构
仓库文件组织
assets.tar:仿真所需资源文件clean/:任务数据,以.tar分片形式组织data_extract.sh:用于递归解压所有数据分片的脚本
分片命名规则
- 对于
ALN、ARR、COLL:<split>_<object_category>_<start_case_id>_<end_case_id>.tar - 对于
STK:<split>_default_<start_case_id>_<end_case_id>.tar
提取后的目录结构示例
clean/ └── ALN/ ├── train/ │ └── bottle/ │ └── 0/ │ ├── environment.yaml │ ├── instructions.txt │ ├── trajectory.pkl │ └── visual/ └── eval/ └── bottle/ └── 0/ ├── environment.yaml ├── instructions.txt ├── trajectory.pkl └── visual/
单个案例文件说明
instructions.txt:语言指令environment.yaml:场景与任务配置trajectory.pkl:专家轨迹数据(时间索引字典),用于模仿学习与回放visual/:可视化资源(如渲染帧或视频)
下载与使用建议
下载数据集
使用 Hugging Face CLI: bash
完整下载
hf download JobsWei/ManiSoft --local-dir ./ManiSoft --repo-type dataset
仅下载数据,不含仿真资源
hf download JobsWei/ManiSoft --local-dir ./ManiSoft --repo-type dataset --exclude "assets.tar"
仅下载评估分片
hf download JobsWei/ManiSoft --local-dir ./ManiSoft --repo-type dataset --include "/eval/"
解压数据分片
使用 data_extract.sh 脚本:
bash
bash data_extract.sh <tar_root_dir> <max_processes> <delete_tar_file>
tar_root_dir:需递归查找.tar文件的根目录max_processes:并行解压进程数(正整数)delete_tar_file:解压后是否删除原.tar文件(0=保留,1=删除)
典型用法: bash
解压所有分片,保留原文件
bash data_extract.sh ./ManiSoft 8 0
解压并删除原文件
bash data_extract.sh ./ManiSoft 8 1
仅解压 clean 子集
bash data_extract.sh ./ManiSoft/clean 8 1
推荐工作流程
bash hf download JobsWei/ManiSoft --local-dir ./ManiSoft --repo-type dataset --exclude "assets.tar" cp /path/to/data_extract.sh ./ManiSoft/ cd ./ManiSoft bash data_extract.sh ./clean 8 1
如需仿真资源,另需执行:
tar -xvf assets.tar
注意事项
- 解压脚本需在类 Unix Shell 环境中运行(支持
bash、find、tar及标准作业控制) - 不同分片可能解压到相同的
train/或eval/目录树,属正常现象 trajectory.pkl是主要的专家轨迹文件,用于模仿学习和回放




