five

eval_fork_hori_9k

收藏
Hugging Face2025-08-09 更新2025-08-10 收录
下载链接:
https://huggingface.co/datasets/JiabinQ/eval_fork_hori_9k
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个关于机器人学领域的数据集,包含机器人行为的不同阶段的视频和位置数据。数据集共有10个剧集,6726个帧,20个视频文件,分为1个块,每个块包含1000个数据点。数据集的帧率为30fps,并且提供了从前方和左侧视角拍摄的图像。数据集的结构包括机器人的多个关节位置信息,如肩部、肘部和手腕的位置,以及夹爪的位置。所有数据均按照Apache-2.0许可证授权。
创建时间:
2025-08-09
原始信息汇总

数据集概述

基本信息

  • 名称: eval_fork_hori_9k
  • 许可证: Apache-2.0
  • 任务类别: 机器人学 (robotics)
  • 相关标签: LeRobot

数据集描述

  • 创建工具: 使用 LeRobot 创建
  • 主页: 无提供
  • 论文: 无提供

数据集结构

  • 数据文件格式: Parquet 文件 (data/*/*.parquet)
  • 代码库版本: v2.1
  • 机器人类型: so101_follower
  • 总集数: 10
  • 总帧数: 6726
  • 总任务数: 1
  • 总视频数: 20
  • 总块数: 1
  • 块大小: 1000
  • 帧率 (FPS): 30
  • 数据分割: 训练集 (train: 0:10)

数据路径

  • 数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

  • 动作 (action)
    • 数据类型: float32
    • 形状: [6]
    • 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
  • 观测状态 (observation.state)
    • 数据类型: float32
    • 形状: [6]
    • 名称: 同动作特征
  • 观测图像 (observation.images.left 和 observation.images.front)
    • 数据类型: video
    • 形状: [480, 640, 3]
    • 视频信息:
      • 高度: 480
      • 宽度: 640
      • 编解码器: av1
      • 像素格式: yuv420p
      • 非深度图
      • 帧率: 30
      • 通道数: 3
      • 无音频
  • 其他特征:
    • timestamp (float32, [1])
    • frame_index (int64, [1])
    • episode_index (int64, [1])
    • index (int64, [1])
    • task_index (int64, [1])

引用

  • BibTeX: 无提供
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人技术领域,eval_fork_hori_9k数据集通过LeRobot框架系统性地采集了真实环境中的机械臂操作数据。该数据集采用分块存储策略,将10个完整操作序列分割为6726帧样本,并以30fps的帧率同步记录多模态观测信息。数据以Parquet格式高效存储,确保了大规模机器人状态与动作序列的结构化整合。
特点
该数据集的核心价值体现在其多维度的机器人交互特征表征。不仅包含6自由度机械臂的关节角度动作向量,还同步提供左右视角的480x640RGB视觉观测流。时序索引与任务标识的精细标注,为模仿学习与强化学习算法提供了时空对齐的多模态监督信号。深度优化的AV1视频编码显著提升了存储效率。
使用方法
研究者可通过加载标准化的Parquet数据块重构完整操作序列,利用帧索引实现动作-观测的精确对齐。视觉流解码需配合视频元数据解析,动作空间可直接映射至SO101型机械臂控制接口。建议采用滑动窗口策略提取时空特征,适用于行为克隆、时空预测等机器人学习任务验证。
背景与挑战
背景概述
机器人学习领域近年来对大规模高质量数据集的需求日益增长,eval_fork_hori_9k数据集应运而生。该数据集由HuggingFace的LeRobot团队基于开源机器人学习框架构建,专门针对多视角视觉运动控制任务设计。数据集采用Apache 2.0开源协议,包含6726帧高精度机械臂运动轨迹数据,配备双视角视觉观测系统,为模仿学习和强化学习算法提供了丰富的训练资源。其核心价值在于通过标准化数据格式推动机器人学习研究的可复现性,为具身智能研究社区提供了重要的基准测试平台。
当前挑战
该数据集致力于解决机器人视觉运动控制中的高维状态动作映射难题,其构建过程面临多重技术挑战。数据采集环节需要精确同步多模态传感器数据,包括双视角视觉流与六自由度机械臂关节状态,对硬件同步精度提出严苛要求。数据处理阶段需克服大规模视频数据压缩存储与快速检索的技术瓶颈,同时保持动作轨迹的时间连续性。在算法层面,数据集需要支持从高维视觉输入到连续动作空间的端到端学习,这对模型的表征学习能力和长期依赖建模构成显著挑战。
常用场景
经典使用场景
在机器人行为学习领域,eval_fork_hori_9k数据集通过多视角视觉观测与六自由度机械臂动作的同步记录,为模仿学习算法提供了标准化的训练与评估基准。该数据集典型应用于端到端策略网络的训练,模型通过左视与前置摄像头输入的高维图像序列,学习生成对应的关节角度控制指令,实现从感知到动作的映射学习。
解决学术问题
该数据集有效解决了机器人示教学习中高维状态-动作映射的样本效率问题,其结构化时空数据支持动态系统建模中的部分可观测马尔可夫决策过程(POMDP)研究。通过提供精确的时间戳对齐和多模态观测,为连续控制策略的泛化性能评估建立了可靠标准,显著推进了基于视觉的机械臂操控任务在真实场景中的算法验证进程。
衍生相关工作
基于该数据集衍生了时空注意力机制的行为克隆框架,其多模态融合架构被后续研究扩展为分层强化学习系统。在LeRobot生态中催生了跨任务策略迁移算法的发展,相关工作进一步推动了基于Transformer的视觉-动作联合建模方法在动态操作任务中的性能突破,形成机器人学习领域新的技术范式。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作