five

my-dataset-7

收藏
Hugging Face2025-04-24 更新2025-04-25 收录
下载链接:
https://huggingface.co/datasets/willnorris/my-dataset-7
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个与机器人学相关的数据集,包含多个剧集(episode),每个剧集中包含若干帧(frame)和任务(task)。数据集被划分为训练集。数据集的特征包括视频数据、机器人状态数据和动作数据。数据集采用Apache-2.0许可证。但是README文件中未提供数据集的具体用途或详细内容的描述。
创建时间:
2025-04-22
原始信息汇总

数据集概述

基本信息

  • 许可证: apache-2.0
  • 任务类别: 机器人学 (robotics)
  • 标签: LeRobot
  • 代码库版本: v2.1
  • 机器人类型: so100

数据集结构

  • 数据文件: data//.parquet
  • 总片段数: 1
  • 总帧数: 84
  • 总任务数: 1
  • 总视频数: 1
  • 总块数: 1
  • 块大小: 1000
  • 帧率 (fps): 30
  • 分割: 训练集 (train): 0:1

数据路径

  • 数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征描述

  • observation.images.cam1:
    • 类型: 视频
    • 形状: [480, 640, 3]
    • 视频信息:
      • 帧率: 30.0
      • 高度: 480
      • 宽度: 640
      • 通道数: 3
      • 编解码器: av1
      • 像素格式: yuv420p
      • 深度图: 否
      • 音频: 无
  • observation.state:
    • 类型: float32
    • 形状: [6]
    • 名称: shoulder_pan, shoulder_lift, elbow_flex, wrist_flex, wrist_roll, gripper
  • action:
    • 类型: float32
    • 形状: [6]
    • 名称: shoulder_pan, shoulder_lift, elbow_flex, wrist_flex, wrist_roll, gripper
  • timestamp:
    • 类型: float32
    • 形状: [1]
  • frame_index:
    • 类型: int64
    • 形状: [1]
  • episode_index:
    • 类型: int64
    • 形状: [1]
  • task_index:
    • 类型: int64
    • 形状: [1]
  • next.done:
    • 类型: bool
    • 形状: [1]
  • index:
    • 类型: int64
    • 形状: [1]

引用信息

  • 主页: [More Information Needed]
  • 论文: [More Information Needed]
  • BibTeX: [More Information Needed]
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人技术领域,高质量的数据集对于算法训练和系统验证至关重要。my-dataset-7数据集依托LeRobot开源框架构建,采用模块化数据采集策略,通过SO100型机器人执行标准化任务序列。数据以Parquet格式存储,包含84帧30fps的视频流及对应的6自由度机械臂状态信息,采用分块存储机制确保数据访问效率,每个数据块容量设计为1000帧,并通过严格的版本控制(v2.1)保证数据一致性。
特点
该数据集的核心价值体现在多模态数据融合与精细标注。480×640分辨率的RGB视频流采用AV1编码,同步记录六轴关节角度(包括肩部平移/抬升、肘部弯曲等运动参数)和时序标记。特征空间设计科学,观测状态与动作空间维度匹配,包含电机位置、帧索引等17个结构化字段,特别标注了机械臂各关节的物理含义,为模仿学习研究提供完整的时空对齐数据。
使用方法
研究者可通过HuggingFace平台直接加载数据集,利用内置的train划分方案(0:1比例)进行模型训练。数据读取遵循'data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet'路径规范,视频文件与传感器数据通过episode_index自动关联。建议使用PyTorch或TensorFlow框架处理float32格式的观测状态,注意帧率同步问题,30fps的视频流需与0.033s的时间戳增量严格对应。
背景与挑战
背景概述
my-dataset-7数据集由LeRobot团队构建,专注于机器人技术领域的研究与应用。该数据集基于Apache 2.0开源协议发布,旨在为机器人控制与行为学习提供高质量的多模态数据支持。数据集包含机械臂运动控制相关的观测图像、状态信息及动作指令,其核心研究问题聚焦于如何通过视觉与状态数据的联合建模提升机器人自主决策能力。尽管具体创建时间与研究团队信息尚未公开,但其采用的标准化数据格式与丰富的特征标注体系,为机器人强化学习算法的开发与验证奠定了重要基础。
当前挑战
该数据集面临的挑战主要体现在两个方面:在领域问题层面,机器人控制任务对时序数据的一致性与动作指令的精确性要求极高,如何从有限的84帧视频数据中提取有效的时空特征是一大难点;在构建过程层面,多传感器数据的同步采集与标定、高维动作空间的规范化表示、以及跨模态数据的对齐处理等技术难题都需要精细解决。此外,数据规模较小且任务单一的特点,也对模型的泛化能力提出了严峻考验。
常用场景
经典使用场景
在机器人控制领域,my-dataset-7数据集以其高精度的机械臂运动记录和视觉数据融合,成为研究机器人动作规划与执行的重要资源。数据集通过记录SO100型机械臂的关节状态、动作指令及同步视觉反馈,为算法开发提供了多模态的实时交互数据。研究者可基于该数据集构建端到端的控制模型,模拟真实环境下的机械臂操作任务。
实际应用
工业自动化场景中,该数据集可直接用于机械臂分拣、装配等任务的算法优化。其记录的6自由度关节控制参数与480p视觉流相结合,能够训练出适应不同光照条件和物体位姿的抓取模型。在医疗机器人领域,类似数据架构可迁移应用于手术器械的精细运动控制研究。
衍生相关工作
基于该数据集的特性,已有研究团队开发了基于Transformer的多模态动作预测框架,其时空注意力机制显著提升了长序列动作生成的准确性。LeRobot社区进一步扩展了类似数据结构,衍生出包含力觉反馈的增强版本,推动了触觉-视觉融合控制算法的发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作