five

asdl-unist/eval_1-multiple-128LR-5aug-32b-VEF-6k-3

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/asdl-unist/eval_1-multiple-128LR-5aug-32b-VEF-6k-3
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由[LeRobot](https://github.com/huggingface/lerobot)创建,涉及机器人技术,特别是so_follower机器人类型。数据集包含动作、观察(状态和来自顶部及腕部摄像头的图像)、时间戳和剧集索引等数据。数据集以parquet文件形式组织,包含视频数据,总共有10个剧集和9847帧。

This dataset was created using [LeRobot](https://github.com/huggingface/lerobot) and pertains to robotics, specifically involving a so_follower robot type. It includes data such as actions, observations (state and images from top and wrist cameras), timestamps, and episode indices. The dataset is structured in parquet files and includes video data, with a total of 10 episodes and 9847 frames.
提供机构:
asdl-unist
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于LeRobot框架构建,专为机器人模仿学习任务设计。数据采集自型号为so_follower的机器人,共包含10个操作片段(episodes),总计9847帧图像与动作序列,数据以30帧/秒的帧率录制。数据集以Parquet格式存储结构化数据,并采用分块(chunk)与分文件形式组织,每个数据块最多包含1000帧;同时,摄像机图像以AV1编码的MP4视频文件保存。全部训练数据被归入一个训练集,无验证或测试划分。
特点
该数据集的核心特色在于其多模态观测结构。动作与机器人状态空间均包含6维关节信息,覆盖肩部、肘部、腕部及夹爪位置,具有极高的物理仿真一致性。视觉信息来源于两台640×480分辨率的RGB摄像头,分别从顶部与腕部视角捕捉环境,形成空间互补的画面。数据集还提供时间戳、帧索引与任务索引等辅助字段,为时序建模与任务解耦提供了结构化支撑。
使用方法
数据集可通过LeRobot库直接加载,用户只需指定数据集标识符即可获得标准化的迭代接口。Parquet文件中的特征字段包含动作、关节状态及多视角图像,适用于构建端到端的模仿学习或行为克隆模型。利用帧索引与片段索引,可方便地重构完整轨迹;任务索引字段则支持多任务训练场景的标签化管理。建议用户优先调用LeRobot内置的DataLoader实现高效的批量采样与数据增强。
背景与挑战
背景概述
该数据集名为eval_1-multiple-128LR-5aug-32b-VEF-6k-3,由Hugging Face社区基于LeRobot框架创建,聚焦于机器人操作领域。数据集记录了一个名为“so_follower”的机器人执行单一任务的10个回合,共9847帧,包含来自顶部和腕部摄像头的640×480像素视频流以及6维关节动作与状态信息(涵盖肩部、肘部、腕部和夹爪)。其核心研究问题在于为模仿学习或强化学习提供高频率(30 FPS)、多模态的机器人操控数据,以推动端到端机器人技能学习的发展。作为开源(Apache-2.0)数据集,它体现了机器人领域从仿真到真实数据民主化的重要趋势,为小型化、可复现的机器人学习研究提供了标准化基准。
当前挑战
该数据集所解决的领域挑战包括:机器人操作中数据采集成本高昂、动作与视觉模态对齐困难、以及小样本场景下策略泛化能力不足——数据集通过提供精确的关节状态与同步视频,试图弥合仿真与真实物理环境之间的差距。构建过程中面临的挑战有:确保10个回合内动作记录与视觉观测的时空一致性,处理高帧率视频(AV1编码)带来的存储与计算开销,以及在不同任务初始化条件下维持数据分布的多样性——数据集仅含单一任务,可能限制其对多任务泛化研究的支持能力。
常用场景
经典使用场景
在机器人学习与操控领域,该数据集承载了从真实或仿真环境中采集的示教数据,尤其适用于模仿学习的研究范式。数据集基于LeRobot框架构建,提供了包含6维关节动作指令、机器人本体状态序列以及多视角视觉观测(顶部与腕部摄像头)的完整时间序列。这些多模态信息被同步记录,每帧30帧的采集频率确保了动作流与视觉流的精确对齐,使研究者能够开展端到端的机器人技能习得实验。典型使用方式包括训练神经网络将视觉输入与机器人状态映射为执行动作,从而复现示教行为。
实际应用
在实际部署场景中,该数据集可用于训练机械臂执行精细化操作任务,如抓取、放置或组装。其多视角图像数据使得机器人能适应不同光照与背景下的工作环境,而动作与状态的一致性则允许在离线阶段进行先验策略的预训练,进而通过少量在线微调适配新场景。数据集提供的标准化结构和清晰的分裂定义,方便开发者将其集成到LeRobot等开源机器人学习平台中,加速从实验室原型到工业级应用的转化。最终,该数据能够降低机器人编程门槛,使得非专家用户通过示教即能让机器人习得灵巧操控能力。
衍生相关工作
基于该数据集的结构与特性,衍生出了一系列关于机器人数据高效利用的研究工作。相关经典工作包括探索跨任务数据共享的预训练框架、融合行为克隆与强化学习的混合训练方法,以及利用扩散模型生成高保真动作序列的策略生成器。此外,该数据集还推动了视觉-动作联合表征学习的发展,研究者尝试利用其多视图视频数据训练视觉编码器,实现状态无关的策略提炼。这些工作不仅验证了该数据集的可用性,更促进了机器人在非结构化环境中部署的可行性与安全性,形成了从数据采集、模型训练到策略迁移的完整技术链条。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作