five

SOARM1/100fiera

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/SOARM1/100fiera
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集使用LeRobot框架创建,专注于机器人技术领域。数据集包含52个episodes,34485帧,涉及1个任务。数据特征包括动作(如肩部、肘部、腕部和夹持器的位置)、观察状态(与动作相同的物理位置信息)、来自三个前置摄像头的图像数据、时间戳、帧索引、episode索引等。数据以parquet格式存储,视频数据以mp4格式存储,帧率为30fps。数据集结构详细记录在meta/info.json文件中,包括数据类型、形状和格式等信息。

This dataset was created using the LeRobot framework, focusing on the robotics domain. It contains 52 episodes, 34,485 frames, and involves 1 task. The features include actions (such as positions of shoulder, elbow, wrist, and gripper), observation states (same physical position information as actions), image data from three front cameras, timestamps, frame indices, episode indices, etc. The data is stored in parquet format, with video data in mp4 format at 30fps. The dataset structure is detailed in the meta/info.json file, including data types, shapes, and formats.
提供机构:
SOARM1
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人学习领域,高质量的数据集是推动算法进步的关键基石。100fiera数据集由SOARM1团队基于LeRobot框架精心构建,旨在为机器人操控任务提供标准化的训练素材。该数据集的采集使用了so_follower机器人平台,通过遥操作方式记录执行单一任务时的完整轨迹。数据集共包含52个演示片段,累积帧数达34485帧,以30帧/秒的采样频率捕获。数据以Parquet格式存储,并辅以AV1编码的视频文件,实现了结构化数据与视觉信息的有机结合。每个片段均包含6维关节空间的动作指令与状态观测,对应机械臂的六个自由度(包括肩部、肘部、腕部及夹爪位置),同时提供三路640×480像素的正面摄像头图像,为模仿学习提供了丰富的多模态信息。
特点
该数据集的核心特点在于其简洁而完整的结构设计。在100MB的Parquet数据和200MB的视频文件中,所有数据均被划分为1000帧大小的块,便于分布式加载与训练。特征设计上,'action'与'observation.state'共享相同的6维关节空间命名体系,这一对齐设计有利于行为克隆等算法的直接应用。三路前视摄像头(front、front1、front2)提供了同一场景的多视角图像,增强了模型对空间信息的感知鲁棒性。此外,数据集包含了timestamp、frame_index、episode_index等元数据字段,支持时序建模与片段级批量处理。所有数据均采用Apache-2.0许可证发布,确保了学术研究与商业应用的友好性。
使用方法
使用该数据集时,推荐通过LeRobot库进行加载与预处理。用户可直接使用HuggingFace上的可视化工具浏览52个片段的示范内容。数据分为训练集(0至51片段),可直接用于训练模仿学习或离线强化学习模型。加载时,Parquet格式的数据可通过Pandas或PyArrow库读取,视频文件则通过CV2或Decord库解码为RGB张量。由于特征命名与LeRobot标准兼容,用户可快速构建数据管道,将action与observation.state映射为策略网络的输入输出。对于需要多视图输入的模型,可同步对齐三路摄像头帧与状态数据,利用提供的chunk索引实现高效批处理。值得注意的是,数据中的'chunks_size'参数为1000,建议根据模型序列长度进行动态打包。
背景与挑战
背景概述
100fiera数据集诞生于机器人学习领域对细粒度操作技能日益增长的探索需求,由研究团队利用LeRobot框架构建,发布于Hugging Face平台,旨在服务于机器人模仿学习任务。该数据集聚焦于单一任务场景,记录了SOARM1型机械臂在52个交互回合中的运动轨迹与视觉观测数据,涵盖肩部、肘部、腕部及夹爪的六维关节状态,并同步采集多视角视频流。通过结构化的动作-状态对与高时间分辨率(30帧/秒)的影像资料,为机器人从人类示范中学习精确操控提供了标准化训练素材。其设计遵循开源精神与模块化原则,致力于降低机器人数据采集门槛,推动可复现的深度学习基准研究,对具身智能体在物理世界中的灵巧操作能力提升具有奠基意义。
当前挑战
当前领域面临的核心挑战在于如何从有限示范中泛化出鲁棒的操作策略,100fiera仅包含52个回合的单一任务数据,其稀疏样本量难以覆盖复杂环境中的随机扰动与目标位姿变化。构建过程中,多观感器同步校准(如三视角深度视频与高维关节状态的对齐)、远距离遥操作示教的非平稳性误差,以及夹爪在抓取脆性物体(如花茎)时的力控精度缺失,均构成显著技术瓶颈。此外,以AV1编解码压缩的高帧率视频流在保留纹理细节与降低存储成本间的平衡,也对数据保真度提出严苛要求,亟需发展小样本强化学习与跨模态特征融合的算法突破。
常用场景
经典使用场景
100fiera数据集是面向机器人操作领域的精细动作捕捉数据集,专为模仿学习与运动规划研究而构建。其核心价值在于提供了高帧率(30 FPS)、多视角视觉观测(三个前置摄像头)与完整6自由度关节状态序列,覆盖了从肩部到夹爪的完整运动链。经典使用场景聚焦于基于视觉的机器人夹取与放置任务,研究人员可利用其中的动作-状态-图像三元组训练端到端策略网络,或作为行为克隆(Behavior Cloning)算法的基准数据。该数据集结构清晰、格式规范,便于集成至LeRobot框架进行对比实验。
衍生相关工作
基于100fiera的数据特性,研究者已衍生出一系列创新工作。在算法层面,涌现了针对多模态感知融合的跨视角一致性表征学习方法,以及利用时间序列预测进行无模型控制的长期规划技术。在工具链方面,该数据集催生了面向低资源场景的机器人数据集蒸馏方案,将原始34485帧压缩为更紧凑的专家轨迹,降低下游任务的计算开销。LeRobot社区也基于其格式标准建立了自动化预处理管线,使得其他研究者可以轻易扩展类似结构的数据集,形成带动臂型机器人领域内的数据生态示范效应。
数据集最近研究
最新研究方向
在机器人操作与模仿学习领域,100fiera数据集为基于视觉的灵巧操作研究提供了高保真度的多视角示范数据。该数据集利用SO_Follower双臂系统采集了52个精细操作轨迹,涵盖6维关节空间(含肩部、肘部、腕部及夹爪)的连续状态与动作映射,并通过三路同步摄像(前端三视角)录制480×640分辨率的视觉流。这一设计使其成为探索基于视觉运动策略(Visual Motor Policy)与行为克隆(Behavioral Cloning)的绝佳平台,尤其适用于研究机器人如何从多视角视频中习得柔顺装配或抓取等复杂技能。随着LeRobot生态的普及,该数据正被用于验证扩散策略(Diffusion Policy)等前沿模型在有限示范下的泛化能力,对推动具身智能中少样本模仿学习的效率边界突破具有重要基石作用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作