WheelArm_WoZ_Pilot_Dataset
收藏数据集概述
数据集名称
WheelArm Synchronized Dataset — 轮椅上机械臂同步数据集。
数据集摘要
这是一个真实机器人数据集,收集自安装在电动轮椅上的 Kinova Gen3 6自由度机械臂。五名受试者在53个任务片段中执行了五项辅助性日常生活任务。每个片段提供来自两个RGB摄像头、两个深度摄像头、所有机器人关节和笛卡尔状态、IMU、轮椅底座状态、摇杆命令、双麦克风音频以及带语用歧义标注的人机对话转录文本的时域对齐数据流。
| 属性 | 数值 |
|---|---|
| 总片段数 | 53 |
| 任务类别 | 5 |
| 受试者人数 | 5 |
| 总大小 | 约47 GB |
| 音频采样率 | 48 kHz 单声道 PCM_16 |
支持的任务
| 任务 | 片段数 |
|---|---|
drinking(饮水) |
9 |
door_opening(开门) |
15 |
drawer_opening(开抽屉) |
16 |
cleaning(清洁) |
4 |
feeding(喂食) |
9 |
数据集结构与命名规则
目录布局示例
WheelArm_WoZ_Multimodal_Pilot/ ├── drinking/ │ ├── 1-drinking-3/ # {受试者}-{任务}-{变体} │ │ ├── cam_0_rgb_video.avi │ │ ├── cam_0_depth.h5 │ │ ├── cam_2_rgb_video.avi │ │ ├── cam_2_depth.h5 │ │ ├── kinova_gen3_joint_states.h5 │ │ ├── kinova_gen3_cartesian_states.h5 │ │ ├── kinova_gen3_imu.h5 │ │ ├── kinova_gen3_wheelchair_states.h5 │ │ ├── kinova_gen3_wheelchair_joy_commands.h5 │ │ ├── headset_audio.wav │ │ ├── laptop_mic.wav │ │ └── synchronization/ │ │ ├── master.jsonl │ │ ├── cam_0_synced_ref_fps.mp4 │ │ ├── cam_2_synced_ref_fps.mp4 │ │ ├── ee_jerk_stats.csv │ │ ├── ee_jerk_timeseries.csv │ │ └── ... │ └── summary/ ├── door_opening/ ├── drawer_opening/ ├── cleaning/ └── feeding/
片段命名规则
格式为 {subject}-{task}-{variant}:
- subject: 1–5的整数,标识操作者
- task: 任务缩写(drinking, door, drawer, cleaning, feeding)
- variant: 同一受试者同一任务下的重复序号
示例: 2-drinking-3 表示受试者2、饮水任务、第3次重复。
数据字段详情
RGB视频
- 文件:
cam_0_rgb_video.avi,cam_2_rgb_video.avi - 摄像头:
cam_0— 第一人称视角;cam_2— 机械臂腕部视角 - 帧率: 约12 Hz;约15 Hz
- 元数据文件 (.metadata): Python pickle对象,包含文件名、总帧数、记录起止Unix时间戳、记录时长、记录频率、每帧Unix时间戳列表
深度数据
- 文件:
cam_0_depth.h5,cam_2_depth.h5 - 格式: HDF5,包含逐帧深度数组
- 元数据:
cam_2_depth.metadata包含帧数、记录频率(约14.7–14.8 Hz)、相机内参(分辨率480×270像素,K矩阵,plumb_bob畸变模型,畸变系数均为0)
机器人运动学数据
所有运动学数据均存储在HDF5文件中,包含时间索引数组:
| 文件 | 内容 |
|---|---|
kinova_gen3_joint_states.h5 |
6个关节的位置(弧度)、速度(弧度/秒)、力矩(牛·米)、时间戳(秒) |
kinova_gen3_cartesian_states.h5 |
末端执行器位置(米) + 四元数姿态 |
kinova_gen3_imu.h5 |
姿态(四元数)、姿态协方差、角速度(弧度/秒)、角速度协方差、线性加速度(米/秒²)、时间戳(秒) |
kinova_gen3_wheelchair_states.h5 |
左右轮角度(弧度)和速度 |
kinova_gen3_wheelchair_joy_commands.h5 |
轴、按钮、时间戳(秒) |
音频数据
- 文件:
headset_audio.wav,laptop_mic.wav - 采样率: 48000 Hz
- 声道: 1(单声道)
- 位深: PCM_16
- 编码帧: 20 ms
- 典型大小: 11–20 MB/文件
- 麦克风: 操作者佩戴的头戴式麦克风 + 捕捉环境声音的笔记本电脑麦克风
对话标注与同步数据
存储在 synchronization/ 子目录中,包含:
| 文件 | 描述 |
|---|---|
master.jsonl |
对话格式的逐轮对话,含图像引用和歧义标签 |
cam_0/2_synced_ref_fps |
按照参考网格时间戳同步后的视频 |
ee_jerk_stats.csv |
末端执行器急动度指标(路径长度、平均/最大急动度、急动能量) |
ee_jerk_timeseries.csv |
末端执行器沿x/y/z轴的急动度、幅度及平方 |
filtered_joints.csv |
滤波后的关节轨迹 |
filtered_ee.csv |
滤波后的末端执行器轨迹 |
timestamps_synced_refgrid.csv |
参考网格同步时间戳 |
refgrid_interpolated_and_filtered.csv |
经零相位四阶巴特沃斯滤波后的数据 |
许可证
cc-by-nc-4.0(知识共享-署名-非商业性使用 4.0 国际)




