five

eval_smolvla_front_top_circe

收藏
Hugging Face2026-04-15 更新2026-04-16 收录
下载链接:
https://huggingface.co/datasets/MichaelP719/eval_smolvla_front_top_circe
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由 LeRobot 创建,主要用于机器人相关任务。数据集采用 Apache 2.0 许可证。数据集结构包括动作、状态观察、图像观察(来自两个摄像头)、时间戳、帧索引、剧集索引、索引和任务索引等特征。动作和状态观察包含六个关节位置信息(shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos)。图像观察的分辨率为 480x640,3通道。数据以 parquet 文件格式存储,视频以 mp4 格式存储。数据集的总剧集数、总帧数和总任务数未明确提供,但数据文件总大小为 100MB,视频文件总大小为 200MB,帧率为 10fps。

This dataset was created by LeRobot and is primarily intended for robotics-related tasks. It is licensed under the Apache 2.0 license. The dataset structure includes features such as actions, state observations, image observations from two cameras, timestamps, frame indices, episode indices, indices, and task indices. Both actions and state observations contain six joint position entries: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, and gripper.pos. The image observations have a resolution of 480x640 with 3 channels. Tabular data is stored in Parquet file format, while video data is stored in MP4 format. The total number of episodes, total frame count, and total number of tasks in the dataset are not explicitly provided. However, the total size of the data files is 100 MB, the total size of the video files is 200 MB, and the frame rate is 10 fps.
创建时间:
2026-04-15
原始信息汇总

数据集概述

基本信息

  • 数据集名称: eval_smolvla_front_top_circe
  • 托管地址: https://huggingface.co/datasets/MichaelP719/eval_smolvla_front_top_circe
  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 相关标签: LeRobot

创建与来源

  • 该数据集使用 LeRobot 创建。
  • 可视化链接: https://huggingface.co/spaces/lerobot/visualize_dataset?path=MichaelP719/eval_smolvla_front_top_circe

数据集结构

  • 数据文件格式: Parquet
  • 数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
  • 代码库版本: v3.0
  • 机器人类型: so_follower
  • 帧率: 10 fps
  • 数据块大小: 1000
  • 数据文件总大小: 100 MB
  • 视频文件总大小: 200 MB
  • 总片段数: 0
  • 总帧数: 0
  • 总任务数: 0

数据特征

  • 动作: 6维浮点数组,对应关节位置(肩部平移、肩部抬升、肘部弯曲、腕部弯曲、腕部旋转、夹爪)。
  • 状态观测: 6维浮点数组,与动作特征结构相同。
  • 图像观测1 (camera1): 视频格式,分辨率480x640,3通道。
  • 图像观测2 (camera2): 视频格式,分辨率480x640,3通道。
  • 时间戳: 单精度浮点数。
  • 帧索引: 64位整数。
  • 片段索引: 64位整数。
  • 数据索引: 64位整数。
  • 任务索引: 64位整数。

附加信息

  • 主页: 未提供
  • 论文: 未提供
  • 引用信息: 未提供
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人学领域,数据集的构建往往依赖于实际物理系统的交互记录。eval_smolvla_front_top_circe数据集通过LeRobot平台生成,采用分块存储策略,将数据组织为多个Parquet文件,每个文件包含1000帧的交互记录。数据采集以10帧每秒的速率进行,同步记录了机器人关节状态、双摄像头视觉信息及时间戳等多模态信号,确保了时序对齐与完整性。这种结构化存储方式不仅提升了数据访问效率,也为大规模机器人学习任务提供了可靠的数据基础。
特点
该数据集在机器人控制与视觉感知研究中展现出显著特点。其核心特征在于融合了六自由度机械臂的关节位置动作与状态观测,并辅以双视角摄像头采集的480x640分辨率RGB图像流,形成了多模态观测空间。数据以分块形式存储,支持高效流式加载,同时包含帧索引、任务索引等元数据,便于进行序列化分析与任务划分。这种设计使得数据集特别适用于需要结合视觉反馈与运动控制的端到端机器人策略学习。
使用方法
为有效利用该数据集进行机器人学习研究,用户可通过LeRobot提供的标准化接口加载数据。数据集以Parquet格式存储,支持按块读取,每块包含连续帧的观测、动作及元数据序列。研究者可依据任务索引划分训练与评估集,利用双摄像头图像作为视觉输入,关节状态作为监督信号,构建基于模仿学习或强化学习的控制模型。数据集的时序对齐特性允许直接用于序列建模,而分块结构则便于分布式训练与增量处理。
背景与挑战
背景概述
在机器人学习领域,高质量的数据集是推动算法进步的关键基石。eval_smolvla_front_top_circe数据集依托于LeRobot开源框架构建,专注于机器人操作任务的数据收集与评估。该数据集由HuggingFace社区成员MichaelP719于近期发布,采用Apache 2.0开源协议,旨在为机器人视觉语言动作模型提供多模态交互数据。其核心研究问题聚焦于如何通过整合视觉观测与关节动作序列,提升机器人在复杂环境中的自主决策与执行能力,对促进机器人模仿学习与强化学习算法的实际应用具有重要价值。
当前挑战
该数据集致力于解决机器人操作任务中的多模态感知与动作生成挑战,具体涉及从视觉输入到连续关节空间动作的精确映射问题。在构建过程中,面临数据采集的复杂性挑战,包括多视角相机同步、高维动作空间的数据标注一致性以及长时序任务中数据分割与对齐的困难。此外,数据集的规模与多样性仍需扩展,以覆盖更广泛的操作场景与任务类型,从而增强模型的泛化性能与鲁棒性。
常用场景
经典使用场景
在机器人学领域,eval_smolvla_front_top_circe数据集为视觉语言动作模型(VLA)的评估提供了关键支持。该数据集通过LeRobot平台构建,包含来自两个摄像头的图像序列、机器人关节状态与动作指令,典型应用于训练和验证机器人模仿学习算法。研究人员利用其多模态数据流,能够模拟真实世界中的机器人操作任务,例如物体抓取与放置,从而推动机器人自主决策能力的发展。
解决学术问题
该数据集有效应对了机器人模仿学习中数据稀缺与评估标准不统一的学术挑战。通过提供结构化、多视角的视觉与动作数据,它使得研究者能够系统性地分析模型在复杂环境下的泛化性能。其意义在于为视觉语言动作模型的基准测试建立了可靠框架,促进了跨模态表示学习与机器人控制策略的融合,对提升机器人智能的鲁棒性与适应性具有深远影响。
衍生相关工作
围绕该数据集,已衍生出一系列专注于机器人视觉语言动作建模的经典研究。这些工作通常利用其多模态特征,开发端到端的控制网络,如基于Transformer的VLA架构,以实现在动态环境中的指令跟随。此外,部分研究进一步扩展了数据集的用途,探索了零样本迁移学习与多任务强化学习,为机器人领域的算法创新提供了丰富实验基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作