five

TriGeneralV4_filt

收藏
Hugging Face2026-04-17 更新2026-04-18 收录
下载链接:
https://huggingface.co/datasets/Yannvdm/TriGeneralV4_filt
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由LeRobot项目创建,主要用于机器人技术相关任务。数据集包含322个episodes,总计173208帧数据,数据以parquet格式存储,总数据量为100MB,视频文件大小为200MB。数据采集频率为30fps。数据集包含多个特征字段,包括动作数据(6个关节位置)、观察状态(6个关节位置)、三个视角的视频数据(前视、手部、侧面,均为480x640分辨率,RGB三通道),以及时间戳、帧索引、episode索引等元数据。视频数据采用h264编码,yuv420p像素格式。数据集适用于机器人控制、行为学习等研究场景,采用Apache-2.0许可证。
创建时间:
2026-04-16
原始信息汇总

数据集概述:TriGeneralV4_filt

基本信息

  • 数据集名称: TriGeneralV4_filt
  • 创建工具: 使用 LeRobot 创建。
  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 标签: LeRobot

数据集规模

  • 总情节数: 322
  • 总帧数: 173,208
  • 总任务数: 1
  • 数据文件大小: 100 MB
  • 视频文件大小: 200 MB
  • 帧率: 30 FPS
  • 数据块大小: 1000
  • 代码库版本: v3.0
  • 机器人类型: so_follower

数据划分

  • 训练集: 包含所有322个情节(索引0至322)。

数据结构与特征

数据以Parquet文件格式存储,路径模式为 data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet。 视频以MP4文件格式存储,路径模式为 videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

特征描述

  1. 动作

    • 数据类型: float32
    • 形状: [6]
    • 内容: 机械臂6个关节的位置(shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos)。
  2. 观测状态

    • 数据类型: float32
    • 形状: [6]
    • 内容: 机械臂6个关节的位置(与动作特征相同)。
  3. 观测图像

    • 前端摄像头图像
      • 数据类型: video
      • 形状: [480, 640, 3] (高度,宽度,通道)
      • 视频信息: 分辨率640x480,30 FPS,H.264编码,YUV420p像素格式,非深度图,无音频。
    • 手部摄像头图像
      • 数据类型: video
      • 形状: [480, 640, 3] (高度,宽度,通道)
      • 视频信息: 分辨率640x480,30 FPS,H.264编码,YUV420p像素格式,非深度图,无音频。
    • 侧面摄像头图像
      • 数据类型: video
      • 形状: [480, 640, 3] (高度,宽度,通道)
      • 视频信息: 分辨率640x480,30 FPS,H.264编码,YUV420p像素格式,非深度图,无音频。
  4. 索引与元数据

    • 时间戳: float32,形状[1]。
    • 帧索引: int64,形状[1]。
    • 情节索引: int64,形状[1]。
    • 索引: int64,形状[1]。
    • 任务索引: int64,形状[1]。

可视化

可通过以下链接可视化此数据集:https://huggingface.co/spaces/lerobot/visualize_dataset?path=Yannvdm/TriGeneralV4_filt

引用信息

  • 主页: [信息缺失]
  • 论文: [信息缺失]
  • BibTeX引用格式: [信息缺失]
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人学习领域,高质量的数据集对于模型训练至关重要。TriGeneralV4_filt数据集依托LeRobot平台构建,通过采集真实机器人操作数据形成结构化记录。该数据集包含322个完整任务片段,总计173208帧数据,以30帧每秒的速率记录。数据以分块形式存储于Parquet文件中,每个块包含1000帧,确保了高效的数据管理与访问。视频数据采用H.264编码,分辨率为640x480,从多个视角捕捉机器人动作,为模型提供了丰富的视觉与状态信息。
特点
该数据集在机器人操作任务中展现出多模态融合的显著特点。它整合了六自由度机械臂的关节位置状态与来自三个不同视角的同步视频流,包括正面、手部和侧面图像。这种设计使得数据集能够全面反映机器人在执行任务时的空间姿态与环境交互。数据以时间序列形式组织,每帧均附带时间戳和索引信息,便于时序建模分析。数据集规模适中,兼顾了数据多样性与处理效率,适用于机器人模仿学习与策略优化研究。
使用方法
研究人员可通过Hugging Face平台直接访问TriGeneralV4_filt数据集,利用其可视化工具直观探索数据内容。数据集采用标准Parquet格式存储,支持通过Python数据处理库进行高效读取与预处理。在使用时,可依据帧索引和片段索引提取特定任务序列,结合动作状态与多视角图像进行联合训练。该数据集适用于开发机器人控制算法,特别是在模仿学习与强化学习框架中,能够为模型提供真实世界的动作示范与环境反馈。
背景与挑战
背景概述
TriGeneralV4_filt数据集是机器人学习领域的一项重要资源,由Hugging Face的LeRobot项目团队创建,旨在推动机器人模仿学习与策略泛化的研究。该数据集聚焦于机器人操作任务,通过整合多视角视觉观测与关节状态数据,为训练端到端的机器人控制模型提供了丰富的交互轨迹。其核心研究问题在于如何利用大规模真实世界演示数据,使机器人能够学习复杂的操作技能,并在动态环境中实现稳健的泛化能力。尽管数据集的具体创建时间与主要研究人员信息尚未公开,但其基于Apache 2.0许可证开放,体现了开源社区对机器人人工智能发展的共同贡献,有望加速机器人自主操作系统的实用化进程。
当前挑战
该数据集旨在解决机器人模仿学习中的策略泛化挑战,即如何从有限的人类演示中学习可迁移的操作策略,以应对真实世界任务的高维状态空间与动态不确定性。构建过程中的挑战包括多模态数据的高效同步与对齐,例如整合来自前视、手部与侧视摄像头的视频流,并确保其与机器人关节动作序列的时间一致性。此外,数据采集涉及复杂的机器人硬件控制与环境设置,需在保证安全性的同时捕获多样化的任务执行轨迹,而数据过滤与标注过程也需克服噪声干扰,以提升数据集的质量与可靠性。
常用场景
经典使用场景
在机器人学领域,TriGeneralV4_filt数据集为模仿学习与强化学习算法的训练与评估提供了关键支持。该数据集通过记录六自由度机械臂在真实环境中的操作轨迹,结合多视角视觉观测与关节状态数据,构建了从感知到动作的完整映射关系。研究人员能够利用这些数据训练端到端的策略网络,使机器人学习复杂的抓取与操控技能,从而在仿真与真实世界之间建立有效的知识迁移桥梁。
实际应用
在实际工业与服务业场景中,TriGeneralV4_filt数据集支撑了自动化装配、物流分拣及家庭服务机器人的技能开发。基于该数据集训练的模型能够指导机械臂完成精细的物体抓取、放置与操作任务,减少对精确预编程的依赖。其多相机视角数据尤其适用于复杂工作空间的视觉伺服控制,为机器人在多变环境中的自主作业提供了可靠的技术方案。
衍生相关工作
围绕该数据集,学术界衍生出一系列专注于机器人视觉运动控制的研究工作。例如,基于行为克隆的轨迹生成方法利用其动作-观测对学习稳健的操作策略;多视角视觉融合技术则通过整合前视、手部与侧视图像提升空间感知精度。此外,该数据集也促进了离线强化学习与模型预测控制在机器人领域的应用,为样本高效且安全的策略学习提供了宝贵的实验平台。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作