eval_so100
收藏Hugging Face2025-09-04 更新2025-09-05 收录
下载链接:
https://huggingface.co/datasets/Thuongg2907/eval_so100
下载链接
链接失效反馈官方服务:
资源简介:
该数据集与机器人学相关,包含多个剧集、帧和数据处理块。数据集中的特征包括机器人的动作和观察数据,以不同的数据类型和形状表示。视频采用AV1编解码器,具有特定的分辨率和帧率。该数据集遵循Apache-2.0许可。不过,README文件中并未提供数据集的详细描述或背景信息。
This dataset is related to robotics, comprising multiple episodes, frames, and data processing blocks. The features within this dataset include robot action and observation data, which are represented using diverse data types and shapes. The videos utilize the AV1 codec and feature specific resolutions and frame rates. This dataset is licensed under the Apache-2.0 license. However, the README file does not provide detailed descriptions or background information regarding this dataset.
创建时间:
2025-08-23
原始信息汇总
数据集概述
基本信息
- 名称: eval_so100
- 许可协议: Apache-2.0
- 任务类别: 机器人学
- 标签: LeRobot
数据集结构
- 总任务数: 1
- 总视频数: 2
- 总片段数: 1
- 片段大小: 1000
- 帧率: 30
- 总帧数: 1879
- 总情节数: 1
- 代码库版本: v2.1
- 机器人类型: so100_follower
- 分割: train(0:1)
数据文件
- 数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
- 视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
特征描述
- 动作: 浮点32,形状[6],包括肩部平移位置、肩部升降位置、肘部弯曲位置、腕部弯曲位置、腕部滚动位置、夹持器位置
- 观测状态: 浮点32,形状[6],包括肩部平移位置、肩部升降位置、肘部弯曲位置、腕部弯曲位置、腕部滚动位置、夹持器位置
- 前视图像观测: 视频类型,形状[480,640,3],包含高度、宽度、通道信息,视频高度480、宽度640、编码器av1、像素格式yuv420p、非深度图、帧率30、通道3、无音频
- 侧视图像观测: 视频类型,形状[480,640,3],包含高度、宽度、通道信息,视频高度480、宽度640、编码器av1、像素格式yuv420p、非深度图、帧率30、通道3、无音频
- 时间戳: 浮点32,形状[1]
- 帧索引: 整型64,形状[1]
- 情节索引: 整型64,形状[1]
- 索引: 整型64,形状[1]
- 任务索引: 整型64,形状[1]
创建信息
- 创建工具: LeRobot(https://github.com/huggingface/lerobot)
引用信息
- 论文: 未提供
- 主页: 未提供
- BibTeX: 未提供
搜集汇总
数据集介绍

构建方式
在机器人技术领域,eval_so100数据集依托LeRobot框架构建,通过记录so100_follower机器人的操作过程生成数据。该数据集采用分块存储策略,将1879帧数据划分为单个块,每块容量为1000帧,并以30fps的帧率采集。数据以parquet格式保存,包含动作指令、观测状态及多视角图像视频,确保了数据的完整性和高效存取。
特点
eval_so100数据集的特点体现在其多维数据结构上,动作和状态观测均以6维浮点数组表征关节位置,涵盖肩部、肘部、腕部和夹持器。图像观测提供前视和侧视双视角视频,分辨率达640x480,采用AV1编码压缩。时序信息如时间戳、帧索引和任务索引均被精确记录,支持精细的时序分析和模型训练。
使用方法
该数据集适用于机器人控制算法的训练与评估,用户可通过加载parquet文件访问动作-观测对,结合视频数据重构机器人操作场景。支持按帧索引提取特定时刻的状态,或按任务划分进行批量处理。其结构化特征便于集成至机器学习管道,用于行为克隆、强化学习等应用,提升模型在真实环境中的泛化能力。
背景与挑战
背景概述
eval_so100数据集作为机器人学习领域的重要资源,由LeRobot团队基于Apache 2.0开源协议构建,专注于机械臂控制与视觉感知的协同研究。该数据集通过集成多模态传感器数据,包括六自由度关节状态、双视角视觉信息及时间序列标记,为模仿学习与强化学习算法提供了真实世界的训练环境。其设计理念源于对机器人泛化能力与操作精度的深度需求,旨在推动家庭服务机器人执行复杂任务时的自适应性能发展。
当前挑战
该数据集核心挑战在于解决高维连续动作空间下的机械臂轨迹优化问题,以及多视角视觉感知与运动控制的跨模态对齐难题。构建过程中需克服真实环境数据采集的时序同步精度保障、多传感器标定误差控制,以及大规模视频数据压缩存储的技术瓶颈。此外,动态环境下的动作标注一致性与数据冗余消除亦是关键挑战。
常用场景
经典使用场景
在机器人学习领域,eval_so100数据集作为标准评估基准,主要用于验证机械臂控制算法的性能表现。该数据集通过记录SO100型跟随机器人的多模态交互数据,包括关节角度状态和双视角视觉信息,为研究人员提供了测试模仿学习与强化学习算法在真实环境中的泛化能力。其结构化时序数据特别适合用于评估端到端控制策略在连续动作空间中的稳定性与精确度。
实际应用
在工业自动化场景中,该数据集支撑的算法可直接应用于精密装配流水线。基于数据集训练的视觉伺服系统能够实现毫米级精度的零件抓取与定位,其双视角视觉配置特别适合复杂环境下的障碍物规避。物流分拣系统中的自主抓取机械臂亦可利用该数据集进行动作轨迹优化,显著提升包裹处理效率与操作安全性。
衍生相关工作
该数据集催生了多项机器人学习领域的创新研究,包括基于时空注意力的多视角视觉编码器设计。部分研究团队利用其时序特性开发了新型行为克隆架构,实现了从视觉输入到关节控制的直接映射。另有工作基于该数据集提出了改进的模仿学习评估指标,为跨模态表征学习提供了新的理论分析框架。
以上内容由遇见数据集搜集并总结生成



