five

eval_temp3

收藏
Hugging Face2025-05-07 更新2025-05-08 收录
下载链接:
https://huggingface.co/datasets/shylee/eval_temp3
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个机器人操作数据集,包含了1个剧集,854帧,1个任务,3个视频和1个数据块。数据集提供了包括主要肩部、肘部、手腕和夹爪的动作和状态信息,以及前视、顶部和手腕摄像头的视频数据。所有数据均以Parquet格式存储,并按照Apache-2.0许可证发布。
创建时间:
2025-05-01
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 标签: LeRobot, tutorial
  • 代码库版本: v2.1
  • 机器人类型: so100

数据集结构

  • 总片段数: 1
  • 总帧数: 854
  • 总任务数: 1
  • 总视频数: 3
  • 总块数: 1
  • 块大小: 1000
  • 帧率 (FPS): 30
  • 数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

动作

  • 数据类型: float32
  • 形状: [6]
  • 名称:
    • main_shoulder_pan
    • main_shoulder_lift
    • main_elbow_flex
    • main_wrist_flex
    • main_wrist_roll
    • main_gripper

观测状态

  • 数据类型: float32
  • 形状: [6]
  • 名称: 同动作特征

观测图像

FrontCam

  • 数据类型: video
  • 形状: [480, 640, 3]
  • 视频信息:
    • fps: 30.0
    • 高度: 480
    • 宽度: 640
    • 通道: 3
    • 编解码器: av1
    • 像素格式: yuv420p
    • 是否为深度图: false
    • 是否有音频: false

TopCam

  • 数据类型: video
  • 形状: [480, 640, 3]
  • 视频信息: 同FrontCam

WristCam

  • 数据类型: video
  • 形状: [480, 640, 3]
  • 视频信息: 同FrontCam

其他特征

  • timestamp: float32, 形状 [1]
  • frame_index: int64, 形状 [1]
  • episode_index: int64, 形状 [1]
  • index: int64, 形状 [1]
  • task_index: int64, 形状 [1]

引用

  • BibTeX: [More Information Needed]
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人技术领域,eval_temp3数据集依托LeRobot框架构建,采用分块存储策略将数据组织为parquet格式文件。该数据集通过记录so100型机器人的操作过程,以30帧每秒的速率采集多模态数据,涵盖机械臂关节动作与三路摄像头视觉信息。每个数据块包含完整的操作序列,通过时间戳与帧索引确保时序一致性,为机器人学习任务提供结构化数据支撑。
特点
eval_temp3数据集展现出多维度的技术特征,其核心在于同步记录六自由度机械臂控制指令与三路高清视频流。前视、顶视与腕部摄像头分别以480x640分辨率捕捉环境动态,动作空间涵盖肩部平移、肘部弯曲等完整关节参数。数据集采用AV1编码压缩视频流,在保持视觉质量的同时优化存储效率,帧索引与任务索引的嵌套结构为时序分析提供便利。
使用方法
针对机器人模仿学习任务,该数据集可通过标准数据加载流程进行调用。研究者可依据数据路径模板访问分块存储的parquet文件,利用动作特征与观察状态构建状态-动作映射关系。三路视觉数据支持多视角环境感知,时间戳与帧索引便于重建操作轨迹,训练集划分明确指向首个数据块,为行为克隆与强化学习算法提供即用型训练样本。
背景与挑战
背景概述
机器人学习领域正经历从仿真环境向真实世界过渡的关键发展阶段,eval_temp3数据集作为LeRobot开源框架的实践成果,通过多视角视觉感知与机械臂控制数据的同步采集,构建了机器人动作学习的基础研究平台。该数据集采用Apache 2.0开源协议,其数据结构包含六自由度机械臂关节控制指令、三路高清视觉传感器流以及时间序列标注,为模仿学习与强化学习算法提供了真实世界的训练样本。虽然具体创建时间与研究团队信息尚未公开,但其标准化数据格式与模块化设计体现了现代机器人学习数据集向可复现、可扩展方向发展的趋势。
当前挑战
在机器人操作任务领域,该数据集需解决高维连续动作空间与多模态感知融合的核心难题,其构建过程面临多重技术挑战。数据采集环节需要保证三路视觉传感器时序严格同步,同时机械臂状态数据与视频帧需实现微秒级对齐。存储架构设计需平衡大规模视频数据压缩效率与读取速度,采用AV1编解码与分块存储方案时需确保数据完整性。此外,真实环境下的光照变化、机械臂运动模糊等干扰因素对数据质量提出更高要求,而缺乏详细的任务描述与基准测试标准则可能影响数据集的学术应用价值。
常用场景
经典使用场景
在机器人学习领域,eval_temp3数据集作为LeRobot项目的重要组成部分,主要应用于机器人控制策略的验证与评估。该数据集通过记录机械臂在执行任务过程中的多模态观测数据,包括关节状态信息和多视角视觉反馈,为强化学习算法提供了丰富的训练样本。研究人员能够利用这些数据训练机器人完成精确的抓取和操作任务,同时验证算法在不同环境条件下的适应性和鲁棒性。
解决学术问题
该数据集有效解决了机器人模仿学习中样本效率低下的核心问题。通过提供包含完整动作序列和对应观测状态的数据,研究者能够深入探索从演示数据到策略学习的转化机制。数据集的结构化设计特别关注了状态-动作对的时序一致性,为研究连续控制任务中的长期依赖关系提供了重要支撑,推动了端到端机器人学习方法的理论发展。
衍生相关工作
围绕eval_temp3数据集,学术界衍生出多项重要研究工作。其中包括基于多模态观测的机器人策略迁移学习框架,以及结合视觉特征与关节状态的动作预测模型。这些工作充分利用了数据集提供的丰富传感器信息,推动了机器人感知-控制一体化方法的发展。相关成果进一步促进了机器人学习基准测试体系的完善,为领域内的算法比较提供了标准化依据。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作