five

so101_Hiwon_task1

收藏
Hugging Face2025-11-25 更新2025-11-26 收录
下载链接:
https://huggingface.co/datasets/hangVLA/so101_Hiwon_task1
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个与LeRobot相关的机器人数据集,包含了42个episodes,总共73854帧,用于单个任务。数据集以parquet文件格式存储,并提供了对应的视频文件。数据包含了动作、观察状态、手腕和前部摄像头图像等多种特征信息。
创建时间:
2025-11-25
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 机器人技术
  • 标签: LeRobot
  • 创建工具: LeRobot (https://github.com/huggingface/lerobot)

数据集结构

  • 总任务数: 1
  • 总回合数: 42
  • 总帧数: 73854
  • 数据块大小: 1000
  • 数据文件大小: 100 MB
  • 视频文件大小: 500 MB
  • 帧率: 30 FPS
  • 数据格式: Parquet
  • 数据路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

动作特征

  • 数据类型: float32
  • 维度: [10]
  • 包含关节:
    • shoulder_pan.pos
    • shoulder_lift.pos
    • elbow_flex.pos
    • wrist_flex.pos
    • wrist_roll.pos
    • gripper.pos
    • base.motor_1
    • base.motor_2
    • base.motor_3
    • base.motor_4

观测特征

状态观测

  • 数据类型: float32
  • 维度: [10]
  • 包含关节: 与动作特征相同

图像观测

手腕摄像头:

  • 数据类型: 视频
  • 分辨率: 480×640×3
  • 视频编码: AV1
  • 像素格式: yuv420p
  • 非深度图

前置摄像头:

  • 数据类型: 视频
  • 分辨率: 480×640×3
  • 视频编码: AV1
  • 像素格式: yuv420p
  • 非深度图

索引特征

  • 时间戳: float32 [1]
  • 帧索引: int64 [1]
  • 回合索引: int64 [1]
  • 数据索引: int64 [1]
  • 任务索引: int64 [1]

数据划分

  • 训练集: 全部42个回合

技术信息

  • 代码库版本: v3.0
  • 机器人类型: so101_follower
  • 视频无音频
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人技术领域,数据采集的精确性与系统性至关重要。so101_Hiwon_task1数据集依托LeRobot平台构建,通过so101_follower型机器人记录了42个完整任务片段,涵盖73,854帧数据。数据以分块形式存储于Parquet文件中,每块包含1,000帧,并同步采集了腕部与前置摄像头的视频流,帧率稳定在30fps。这种结构化存储方式既保障了数据完整性,又提升了存取效率。
特点
该数据集在机器人操作任务中展现出多维特征融合的显著特点。动作空间包含10维关节角度与底盘电机控制量,观测状态则同步记录相同维度的机械臂位姿。视觉模态方面,双视角RGB视频以480×640分辨率呈现操作场景,时间戳与帧索引为时序分析提供支撑。所有数据均采用float32与int64精度存储,确保了数值计算的稳定性与内存使用的优化。
使用方法
针对机器人模仿学习的研究需求,该数据集可直接通过HuggingFace生态系统加载。研究者可利用标准数据管道读取Parquet格式的观测-动作对,结合对应MP4视频文件进行行为克隆或强化学习训练。数据已预划分为训练集,支持按片段索引提取连续轨迹,其统一的张量形状便于直接输入神经网络模型进行端到端策略学习。
背景与挑战
背景概述
机器人技术领域近年来在模仿学习方向取得显著进展,so101_Hiwon_task1数据集作为LeRobot项目的重要组成部分,聚焦于多模态机器人控制任务。该数据集通过整合机械臂关节状态、基座运动参数及双视角视觉信息,构建了包含42个完整交互序列的大规模示范数据。其核心研究目标在于探索基于视觉感知的端到端机器人策略学习,为具身智能系统在复杂环境中的自主决策提供数据支撑。
当前挑战
该数据集面临的核心领域挑战在于解决高维连续动作空间与多模态感知的协同建模问题,需克服视觉-运动链路的语义对齐难题。构建过程中存在数据同步精度控制的技术瓶颈,包括10自由度机械臂轨迹与双路高清视频帧的时序对齐,以及跨模态特征在分布式存储中的一致性维护。此外,大规模示范数据的质量验证与异常检测机制亦构成重要挑战。
常用场景
经典使用场景
在机器人控制领域,so101_Hiwon_task1数据集通过整合多模态传感器数据与机械臂动作序列,为模仿学习算法提供了标准化的训练环境。其包含的腕部与前置视觉观测数据配合关节状态信息,能够完整还原机器人执行跟随任务时的动态场景,成为评估端到端控制策略有效性的基准平台。
实际应用
基于该数据集训练的模型可部署于工业流水线辅助作业场景,实现机械臂对移动目标的实时追踪与协同操作。其多视角视觉反馈机制能适应复杂环境下的动态干扰,在物流分拣、精密装配等需要人机协作的领域展现出精准的任务执行能力,有效提升自动化系统的柔性适应水平。
衍生相关工作
该数据集催生了基于时空注意力机制的模仿学习框架,衍生出如分层动作预测网络、多视角特征融合模型等创新方法。相关研究通过挖掘数据集中连续帧间的运动规律,发展了具有时序建模能力的机器人控制架构,为后续动态场景下的行为克隆算法提供了重要范式参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作