TAVIS
收藏TAVIS 数据集详情
概述
TAVIS (Torso Active Vision Imitation-learning Suite) 是一个用于以自我为中心主动视觉模仿学习和人体躯干预期注视的基准测试平台。它提供了跨两个机器人平台(Fourier GR1T2 和 Pollen Reachy 2)的八个模拟操作任务,总计 2200 次 VR 远程操作演示,预训练的 π₀ 基线模型,以及一个专有度量指标——GALT(Gaze–Action Lead Time,注视-动作超前时间),用于量化学习策略中的预期注视行为。
评估内容
TAVIS 旨在支持以下三个方面的评估声明:
- 模仿学习中的主动视觉:头戴式自我中心摄像头相对于固定摄像头基线是否能提升任务性能
- 预期注视:策略能否复现人类演示中“头先于手”的时间结构(通过 GALT 以秒为单位测量)
- 跨本体的共享任务/动作设计:相同任务在两个人形躯干上运行,采用统一的 19 维动作布局
每个(机器人 × 任务 × 评估模式)单元在 96 个随机回合 上进行评估,成功率附带 Wilson 95% 置信区间报告。
可用资源
| 资源类型 | 位置 |
|---|---|
| 数据集 (LeRobot v3.0) | https://huggingface.co/tavis-benchmark |
| 预训练 π₀ 检查点 | https://huggingface.co/tavis-benchmark |
| 机器人/任务 USD 资产 | https://huggingface.co/datasets/tavis-benchmark/tavis-assets |
| Quest 远程操作 APK | 随版本发布 |
硬件要求
- 仿真/数据收集/评估:需要支持光线追踪的 NVIDIA GPU(如 RTX 4090、A6000、L40 等)
- 训练:扩散策略适配单张 24GB 显卡;π₀ 训练需 H100;π₀-LoRA 适配单张 24GB 显卡
- 远程操作:需开启开发者模式的 Meta Quest 2/3
任务与数据集
任务分类
TAVIS 包含两个子套件:
- TAVIS-HEAD:5 个任务
- TAVIS-HANDS:3 个任务
可用数据集(多任务套件)
| 仓库 | 机器人 | 套件 | 回合数 |
|---|---|---|---|
tavis-benchmark/tavis-head-gr1t2 |
GR1T2 | TAVIS-HEAD | 800 |
tavis-benchmark/tavis-head-reachy2 |
Reachy2 | TAVIS-HEAD | 800 |
tavis-benchmark/tavis-hands-gr1t2 |
GR1T2 | TAVIS-HANDS | 300 |
tavis-benchmark/tavis-hands-reachy2 |
Reachy2 | TAVIS-HANDS | 300 |
预训练 π₀ 检查点
| 仓库 | 机器人 | 套件 | 摄像头 |
|---|---|---|---|
tavis-benchmark/pi0-tavis-head-gr1t2-headcam |
GR1T2 | TAVIS-HEAD | 头部 |
tavis-benchmark/pi0-tavis-head-gr1t2-fixedcam |
GR1T2 | TAVIS-HEAD | 固定 |
tavis-benchmark/pi0-tavis-head-reachy2-headcam |
Reachy2 | TAVIS-HEAD | 头部 |
tavis-benchmark/pi0-tavis-head-reachy2-fixedcam |
Reachy2 | TAVIS-HEAD | 固定 |
tavis-benchmark/pi0-tavis-hands-gr1t2 |
GR1T2 | TAVIS-HANDS | 头部 |
tavis-benchmark/pi0-tavis-hands-reachy2 |
Reachy2 | TAVIS-HANDS | 头部 |
关键特性
GALT 度量
GALT(注视-动作超前时间)是 TAVIS 提出的一个本体感知度量,仅消耗 19 维命令动作轨迹(手臂末端执行器位置 + 头部关节 + 夹爪标量),可移植到任何具有这些通道的机器人上。
评估模式
完整的评估模式分类见 docs/ood_modes.md,包括标准模式(id)和多种分布外(ood_*)模式。
仓库结构
tavis/ ├── tavis/ │ ├── robots/ # GR1T2, Reachy2 实施例 │ ├── tasks/ # 8 个任务定义 │ ├── eval/ # GALT 检测器 + 基准评估核心 │ ├── benchmark/ # 套件定义 │ ├── wrappers/ # CanonicalFrame, InitPose, experiment │ ├── teleop/ # Quest TCP 服务器 + 主循环 │ ├── controllers/ # 零空间逆运动学 │ ├── actions/ # 自定义动作项(如夹爪模仿) │ ├── mdp/ # 观测项 │ ├── make_env.py # 环境构建入口 │ └── download_assets.py # 资产下载器 ├── scripts/ │ ├── teleop_main.py # 运行 VR 远程操作 + 数据集录制 │ ├── train_policy.py # DP/ACT/SmolVLA/π₀ 训练 │ ├── eval_policy.py # 单任务评估(可选 GUI) │ ├── eval_benchmark.py # 正式完整基准评估 │ └── print_benchmark_results.py # 汇总评估 JSON 为 ASCII 表格(Wilson 置信区间) ├── quest_app/ # Meta Quest Unity 项目 ├── docs/ # 按主题分类的文档 ├── pyproject.toml └── LICENSE
许可证
- 代码:MIT 许可证
- 数据集:CC-BY-4.0(通过 Hugging Face 上的
tavis-benchmark/发布) - 机器人模型、YCB 对象和任务资产:遵循各自上游来源的许可证
文档索引
| 主题 | 文件 |
|---|---|
| GALT 度量及移植到您自己的机器人 | docs/galt.md |
| 添加新机器人 | docs/extending_robots.md |
| 添加新任务 | docs/extending_tasks.md |
| 评估模式 (id, ood_*) | docs/ood_modes.md |
| 数据收集 (VR 远程操作) | docs/data_collection.md |




