five

drone_flight_no_buildings30

收藏
Hugging Face2026-04-20 更新2026-04-21 收录
下载链接:
https://huggingface.co/datasets/Grigorij/drone_flight_no_buildings30
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是使用LeRobot创建的,适用于机器人技术领域。数据集包含30个episodes,总计5021帧,涉及1个任务。数据以parquet文件格式存储,总数据文件大小为100MB,视频文件大小为200MB,帧率为30fps。数据集包含多个特征,包括两个摄像头(前置和底部)的视频观察数据,视频分辨率为480x640,3通道,编码格式为av1。此外,还包括状态观察、动作(vx, vz, yaw)、时间戳、帧索引、episode索引、索引和任务索引等字段。数据集适用于机器人控制、行为学习等任务。
创建时间:
2026-04-19
原始信息汇总

数据集概述

基本信息

  • 数据集名称: drone_flight_no_buildings30
  • 创建工具: LeRobot (https://github.com/huggingface/lerobot)
  • 许可证: Apache 2.0
  • 任务类别: 机器人学
  • 标签: LeRobot

数据集规模

  • 总情节数: 30
  • 总帧数: 5021
  • 总任务数: 1
  • 数据文件大小: 100 MB
  • 视频文件大小: 200 MB
  • 帧率: 30 FPS
  • 数据块大小: 1000
  • 代码库版本: v3.0

数据划分

  • 训练集: 包含全部30个情节 (索引范围: 0:30)

数据结构与特征

数据以Parquet文件格式存储,路径模式为:data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet。 视频以MP4文件格式存储,路径模式为:videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

特征字段说明

  1. observation.images.camera_front

    • 类型: 视频
    • 形状: [480, 640, 3] (高度, 宽度, 通道)
    • 视频信息:
      • 高度: 480
      • 宽度: 640
      • 编解码器: av1
      • 像素格式: yuv420p
      • 非深度图
      • 帧率: 30
      • 通道数: 3
      • 无音频
  2. observation.images.camera_bottom

    • 类型: 视频
    • 形状: [480, 640, 3] (高度, 宽度, 通道)
    • 视频信息:
      • 高度: 480
      • 宽度: 640
      • 编解码器: av1
      • 像素格式: yuv420p
      • 非深度图
      • 帧率: 30
      • 通道数: 3
      • 无音频
  3. observation.state

    • 数据类型: float32
    • 形状: [1]
    • 维度名称: ["height"]
  4. action

    • 数据类型: float32
    • 形状: [3]
    • 维度名称: ["vx", "vz", "yaw"]
  5. timestamp

    • 数据类型: float32
    • 形状: [1]
    • 维度名称: 无
  6. frame_index

    • 数据类型: int64
    • 形状: [1]
    • 维度名称: 无
  7. episode_index

    • 数据类型: int64
    • 形状: [1]
    • 维度名称: 无
  8. index

    • 数据类型: int64
    • 形状: [1]
    • 维度名称: 无
  9. task_index

    • 数据类型: int64
    • 形状: [1]
    • 维度名称: 无

可视化

数据集可通过Hugging Face Spaces进行可视化:https://huggingface.co/spaces/lerobot/visualize_dataset?path=Grigorij/drone_flight_no_buildings

引用信息

  • 主页: 未提供
  • 论文: 未提供
  • BibTeX引用: 未提供
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人学领域,无人机自主飞行数据的采集对于算法验证至关重要。drone_flight_no_buildings30数据集通过LeRobot平台构建,包含了30个完整飞行片段,总计5021帧数据。数据以分块形式存储,每块约1000帧,采用Parquet格式高效组织,同时配套存储了AV1编码的MP4视频文件。该数据集专注于无建筑物环境下的飞行任务,通过前置与底部双摄像头捕捉480x640分辨率的视觉信息,并以30帧每秒的速率同步记录飞行状态与动作指令。
特点
该数据集在机器人视觉与控制系统研究中展现出独特价值。其核心特征在于提供了多模态的飞行记录,包括双视角视觉流、无人机状态向量以及三维动作指令。视觉数据采用标准RGB格式,确保了与主流计算机视觉模型的兼容性;动作空间明确划分为水平速度、垂直速度与偏航角,为策略学习提供了清晰的动作接口。数据以时间序列完整呈现,附带帧索引与时间戳,便于进行时序分析与离线强化学习研究。所有数据均经过结构化处理,便于直接加载与批量处理。
使用方法
研究人员可利用该数据集进行无人机自主导航算法的开发与评估。通过Hugging Face平台可直接访问数据文件,利用Parquet读取工具加载观测图像、状态及动作序列。数据集已预设训练划分,涵盖全部30个片段,适用于端到端的模仿学习或行为克隆任务。配套的视频文件可供直观可视化飞行轨迹。在具体应用中,可提取observation.images.camera_front与camera_bottom作为视觉输入,结合observation.state作为环境表征,并以action作为监督信号,构建感知-控制映射模型。
背景与挑战
背景概述
无人机自主飞行技术作为机器人学领域的前沿研究方向,其核心在于实现复杂环境下的精准导航与稳定控制。drone_flight_no_buildings30数据集由HuggingFace社区的LeRobot项目团队构建,旨在为无人机在无建筑干扰的开放空间中的飞行行为提供标准化评估基准。该数据集收录了30个完整飞行片段,涵盖超过5000帧的双视角视觉观测与三维动作指令,通过高频率传感器数据捕捉飞行器的动态状态,为强化学习与模仿学习算法提供了丰富的训练与验证资源。其结构化设计不仅促进了无人机控制策略的迭代优化,也推动了机器人学中视觉-动作映射模型的通用性研究。
当前挑战
无人机飞行控制面临的核心挑战在于如何从多模态感知数据中提取鲁棒特征,以应对开放环境中的动态扰动与状态不确定性。drone_flight_no_buildings30数据集所针对的领域问题聚焦于视觉引导的无人机自主导航,其难点在于建立高维图像序列与低维连续动作空间之间的稳定映射关系,同时需克服传感器噪声与延迟对控制精度的影响。在数据构建过程中,挑战主要体现于大规模真实飞行数据的同步采集与标注,包括双摄像头视频流与惯性测量单元的时间对齐、动作指令的精确记录,以及非结构化环境中飞行轨迹的安全性与多样性平衡。此外,数据集的规模有限性与场景单一性也制约了模型在更复杂环境中的泛化能力。
常用场景
经典使用场景
在机器人学领域,无人机自主飞行是研究热点,drone_flight_no_buildings30数据集为这一方向提供了关键支持。该数据集通过记录无人机在无建筑环境中的飞行轨迹,包含前置与底部摄像头的视觉数据及状态动作序列,常用于训练视觉导航模型。研究者利用其丰富的时序信息,模拟无人机在开阔空间中的避障与路径规划任务,为端到端控制策略的验证奠定基础。
实际应用
在实际应用中,drone_flight_no_buildings30数据集可服务于农业监测、地形勘探与紧急救援等场景。无人机在无建筑区域的飞行数据能够优化自主巡航算法,提升在野外或开阔地带的作业效率。例如,基于该数据集训练的模型可协助无人机精准执行作物巡查或物资投送任务,降低人工干预需求,推动智能机器人在户外环境中的部署与普及。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作,主要集中在视觉-动作映射与跨域策略适应方面。学者们利用其多模态特征开发了端到端飞行控制系统,并在此基础上探索了少样本学习与模拟到真实的迁移方法。这些工作不仅拓展了无人机自主行为的理论边界,还为开源机器人平台如LeRobot提供了丰富的实验基准,促进了社区协作与技术创新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作