DroneMotion-99k

Hugging Face2024-12-22 更新2024-12-23 收录

下载链接：

https://huggingface.co/datasets/yunzhong-hou/DroneMotion-99k

下载链接

链接失效反馈

官方服务：

资源简介：

DroneMotion-99k数据集包含Colmap 3D重建结果和过滤后的摄像机运动序列，用于自动化摄像机运动控制。数据集提供了最小版本（10个视频和129个序列）和完整版本（13,653个视频和99,003个摄像机轨迹）。完整数据集被分为四个部分，用户需要先合并再解压。数据集不包含视频MP4或帧，但提供了自动下载视频和提取帧的Python脚本。

创建时间：

2024-12-16

原始信息汇总

DroneMotion-99k 数据集

数据集概述

DroneMotion-99k 数据集提供了 Colmap 3D 重建结果和经过筛选的无人机运动序列。该数据集包含两种版本：

最小数据集：包含 10 个视频和 129 个序列。
完整数据集：包含 13,653 个视频和 99,003 个相机轨迹。

数据集结构

完整数据集被分为四个 tar.gz 文件：

dataset_full.part1.tar.gz dataset_full.part2.tar.gz dataset_full.part3.tar.gz dataset_full.part4.tar.gz

需要将这些文件合并并解压以获取原始的 HDF5 文件 dataset_full.h5。

数据集下载与处理

合并文件： sh cat dataset_full_* > reassembled.tar.gz
解压文件： sh tar -xvzf reassembled.tar.gz

数据集内容

下载后的数据集文件夹结构如下：

dvgformer/ ├── youtube_drone_videos/ │ ├── dataset_full.h5 │ └── dataset_mini.h5 ├── src/ ├── README.md ...

视频下载与帧提取

由于 YouTube 政策限制，数据集中不包含视频 MP4 文件或帧。但提供了一个 Python 脚本 download_videos.py，可以帮助自动下载视频并提取帧。 sh python download_videos.py --hdf5_fpath youtube_drone_videos/dataset_mini.h5 python download_videos.py --hdf5_fpath youtube_drone_videos/dataset_full.h5

参考

更多详细信息请参考指南。

搜集汇总

数据集介绍

构建方式

DroneMotion-99k数据集通过从在线视频中进行3D重建，收集了99,003条高质量的无人机摄像机轨迹。具体而言，该数据集利用Colmap工具对视频进行3D重建，通过连接连续帧中的摄像机姿态来构建3D摄像机路径，并使用Kalman滤波器识别和去除低质量数据，从而确保数据的高质量和多样性。

使用方法

用户可以通过下载完整或迷你版本的DroneMotion-99k数据集，并使用提供的Python脚本自动下载相关视频帧。数据集以HDF5格式存储，用户需先合并并解压tar.gz文件以获取完整数据。下载后，用户可利用该数据集进行无人机摄像机运动控制的研究和模型训练，特别是通过DVGFormer等自动化系统来预测和生成高质量的摄像机运动轨迹。

背景与挑战

背景概述

随着无人机技术的迅猛发展，无人机视频在影视制作、监控和娱乐等领域展现出巨大的应用潜力。然而，现有的AI视频制作方法在模拟训练中面临外观多样性不足、专家操作记录成本高昂以及设计启发式目标覆盖所有场景的困难。为解决这些问题，Yunzhong Hou、Liang Zheng和Philip Torr等研究人员于2024年提出了DroneMotion-99k数据集，旨在通过收集真实世界的无人机视频数据，自动提取相机轨迹，并训练一种不依赖启发式的有效架构。该数据集包含99,003条高质量的相机轨迹，通过3D重建技术从在线视频中提取，并使用Kalman滤波器去除低质量数据，为无人机视频的自动化拍摄提供了丰富的训练资源。

当前挑战

DroneMotion-99k数据集的构建面临多重挑战。首先，从在线视频中进行3D重建并提取高质量的相机轨迹，需要克服视频质量参差不齐、数据噪声大等问题。其次，由于无人机视频的视角和运动模式复杂多样，设计能够覆盖所有场景的自动化拍摄算法具有较高的技术难度。此外，数据集的规模庞大，存储和处理这些数据对计算资源提出了较高的要求。最后，由于YouTube政策限制，无法直接共享视频MP4文件或帧，用户需自行下载视频并提取帧，增加了数据集的使用复杂性。

常用场景

经典使用场景

DroneMotion-99k数据集的经典使用场景主要集中在无人机视频拍摄中的摄像机运动控制。该数据集通过收集和分析99,003条高质量的摄像机轨迹，为研究者提供了一个丰富的资源库，用于训练和验证自动摄像机运动控制算法。这些算法可以学习如何执行复杂的摄像机运动，如穿越障碍物、保持低空飞行以增加速度感，以及围绕塔楼和建筑物进行环绕拍摄，从而生成高质量的视频内容。

解决学术问题

DroneMotion-99k数据集解决了现有AI视频制作方法中的一些关键学术问题，如模拟训练中外观多样性不足、专家操作记录成本高昂以及设计基于启发式的目标覆盖所有场景的困难。通过利用真实世界的训练数据，该数据集提高了数据的多样性，自动提取摄像机轨迹以减少标注成本，并训练了一种不依赖启发式的有效架构，从而推动了摄像机运动控制领域的研究进展。

实际应用

在实际应用中，DroneMotion-99k数据集为无人机视频拍摄提供了强大的技术支持。例如，在电影制作、新闻报道和体育赛事直播中，自动摄像机运动控制可以显著提升视频的视觉质量和观众的沉浸感。此外，该数据集还可用于无人机导航系统的开发，帮助无人机在复杂环境中安全、高效地执行任务。

数据集最近研究