tictactoe_v2
收藏Hugging Face2025-11-21 更新2025-11-22 收录
下载链接:
https://huggingface.co/datasets/wsi-dev/tictactoe_v2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个机器人学任务的数据集,使用LeRobot工具创建。它包含了181个剧集,59840个帧,共9个任务。数据集的结构详细描述了包含的动作、状态观察、正面图像、手腕图像等多种特征。数据以parquet文件格式存储,视频以mp4格式存储。训练集的划分是从第0个到第181个剧集。每个数据文件的大小约为100MB,视频文件的大小约为500MB。
创建时间:
2025-11-18
原始信息汇总
Tictactoe_v2 数据集概述
基本信息
- 许可证: Apache-2.0
- 任务类别: 机器人学
- 相关标签: LeRobot
数据集规模
- 总任务数: 9
- 总回合数: 181
- 总帧数: 59840
- 数据文件大小: 100 MB
- 视频文件大小: 500 MB
数据结构
- 数据格式: Parquet文件
- 数据路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
- 视频路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
- 分块大小: 1000
- 帧率: 30 fps
- 数据划分: 训练集包含全部181个回合
特征描述
动作特征
- 数据类型: float32
- 维度: [6]
- 关节位置:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos
状态观测
- 数据类型: float32
- 维度: [6]
- 关节位置观测: 与动作特征相同的6个关节位置
图像观测
前视摄像头:
- 数据类型: 视频
- 分辨率: 480×640×3
- 视频编码: AV1
- 像素格式: yuv420p
- 非深度图
腕部摄像头:
- 数据类型: 视频
- 分辨率: 480×640×3
- 视频编码: AV1
- 像素格式: yuv420p
- 非深度图
元数据特征
- 时间戳: float32 [1]
- 帧索引: int64 [1]
- 回合索引: int64 [1]
- 数据索引: int64 [1]
- 任务索引: int64 [1]
技术信息
- 机器人类型: so101_follower
- 代码库版本: v3.0
- 创建工具: LeRobot (https://github.com/huggingface/lerobot)
搜集汇总
数据集介绍

构建方式
在机器人技术领域,数据集的构建质量直接影响算法模型的性能。tictactoe_v2数据集通过LeRobot平台系统采集,包含181个完整任务片段,总计59840帧数据,以30帧/秒的速率记录。数据采用分块存储机制,每1000帧构成一个数据块,以Parquet格式保存关节位置、图像观测等多维信息,视频流则通过AV1编解码器压缩存储,形成结构化机器人交互数据库。
特点
该数据集展现了机器人操作任务的典型特征,其观测空间包含六自由度关节状态与双视角视觉信息,前视与腕部相机均提供480×640分辨率RGB流。动作空间采用六维连续向量表征机械臂各关节及末端执行器位姿。时序数据通过帧索引与时间戳精确对齐,支持长序列行为分析,数据总量达600MB,兼具高维度与实时性优势。
使用方法
针对机器人模仿学习研究需求,该数据集可直接加载为标准强化学习环境输入。研究者可通过解析Parquet文件获取状态-动作对序列,利用帧索引重建任务轨迹。视频数据与关节状态的时间同步特性支持多模态融合训练,分块存储结构便于流式读取,适用于行为克隆、逆动力学学习等算法验证,为具身智能研究提供基准数据支撑。
背景与挑战
背景概述
在机器人技术迅猛发展的背景下,tictactoe_v2数据集由HuggingFace的LeRobot项目构建,专注于机器人操作任务的仿真与学习。该数据集通过记录六自由度机械臂的关节位置状态与多视角视觉观测,为机器人模仿学习与策略优化提供了丰富的数据支持。其包含181个任务片段与近六万帧数据,覆盖了从状态感知到动作执行的完整闭环,显著推动了机器人自主操作能力的研究进程。
当前挑战
该数据集致力于解决机器人操作任务中的动作规划与多模态感知融合难题,具体挑战包括高维连续动作空间的精确建模、视觉观测与关节状态的时间对齐、以及跨任务泛化能力的实现。在构建过程中,面临数据采集同步性保障、大规模视频流的高效压缩存储、以及多传感器数据标定一致性等工程挑战,这些因素共同制约了数据集的质量与可用性。
常用场景
经典使用场景
在机器人学习领域,tictactoe_v2数据集作为LeRobot项目的重要组成部分,为模仿学习算法的开发提供了丰富资源。该数据集通过记录六自由度机械臂的关节位置与多视角视觉数据,构建了完整的动作-观测序列,常用于训练端到端的机器人控制策略。其高频率采样与多模态特性使研究者能够精确复现人类演示的轨迹,为行为克隆等算法提供标准化评估基准。
实际应用
在工业自动化场景中,该数据集支撑的算法可应用于精密装配、物料分拣等流程。通过前端与腕部摄像头的协同感知,系统能适应复杂的光照变化与遮挡干扰,其记录的抓取器位姿数据可直接指导真实机械臂完成精细操作。这种基于实际机器人平台采集的数据,显著降低了从仿真到实物的迁移成本。
衍生相关工作
基于该数据集的特性,衍生出多模态表征学习与跨任务泛化等研究方向。相关研究通过解耦视觉特征与运动轨迹的关联性,开发出适应动态环境的元学习框架。部分工作进一步探索了视频预测与动作序列生成的联合建模,为机器人长期任务规划提供了新的技术路径。
以上内容由遇见数据集搜集并总结生成



