five

Okutama-Action

收藏
arXiv2017-06-16 更新2024-07-25 收录
下载链接:
http://okutama-action.org/
下载链接
链接失效反馈
官方服务:
资源简介:
Okutama-Action数据集是由国家信息学研究所等机构合作创建,专注于从无人机视角捕捉的并发人类动作检测。该数据集包含43个完全标注的视频序列,涵盖12种户外动作类别,总计77365帧,分辨率达3840x2160。数据收集过程中,无人机在不同高度和角度下捕捉视频,确保动作的清晰可见和可区分性。该数据集旨在推动真实世界应用中的动作检测技术,特别是在监控和搜索救援任务中识别和跟踪人类动作的需求。

Okutama-Action Dataset was co-created by the National Institute of Informatics and other collaborating institutions, focusing on concurrent human action detection captured from unmanned aerial vehicle (UAV) perspectives. This dataset contains 43 fully annotated video sequences, covering 12 outdoor action categories, with a total of 77,365 frames and a resolution of 3840×2160. During data collection, drones captured videos at varying altitudes and angles to ensure clear visibility and discriminability of the actions. This dataset aims to advance action detection technologies for real-world applications, particularly catering to the demands of identifying and tracking human actions in surveillance and search-and-rescue tasks.
提供机构:
国家信息学研究所
创建时间:
2017-06-10
搜集汇总
数据集介绍
main_image_url
构建方式
Okutama-Action数据集通过无人机(UAVs)在不同高度和角度下捕捉视频,以获取多样化的序列。所有视频均在日本的Okutama棒球场使用DJI Phantom 4无人机拍摄,涵盖了从10到45米的不同飞行高度和45或90度的相机角度。数据集包含43个全标注的分钟级序列,涵盖12种典型的户外动作类别。每个序列的时长远超其他数据集,更接近真实世界任务中对象需长时间跟踪的场景。
使用方法
Okutama-Action数据集适用于训练和评估从无人机视角进行并发人类动作检测的模型。数据集被分为训练验证集(33个序列)和测试集(10个序列),确保测试集包含多样化的挑战,以评估模型的鲁棒性。研究者可以使用该数据集来开发和验证新的动作检测算法,特别是那些能够处理多标签输出和动态场景变化的算法。
背景与挑战
背景概述
Okutama-Action数据集由慕尼黑工业大学、斯德哥尔摩皇家理工学院、巴塞罗那理工大学、台湾大学、东京大学和国家信息学研究所的研究人员共同创建,旨在解决现有数据集在无人机视角下人类行为检测的代表性不足问题。该数据集包含43个全标注的分钟级视频序列,涵盖12种户外常见行为类别,如阅读、握手、饮用和搬运等。Okutama-Action数据集的独特之处在于其动态行为转换、显著的尺度与宽高比变化、突发的摄像机移动以及多标签演员等特性,使其成为推动实际应用中人类行为检测技术发展的关键资源。
当前挑战
Okutama-Action数据集面临的挑战包括动态行为转换的复杂性、显著的尺度与宽高比变化、突发的摄像机移动以及多标签演员的识别问题。这些挑战使得现有算法在该数据集上的表现显著下降,表明需要开发更先进的动作检测模型以应对实际应用中的复杂场景。此外,数据集的构建过程中还面临了如何确保视频序列的代表性、多样性和真实性,以及如何高效且准确地进行视频标注等技术难题。
常用场景
经典使用场景
Okutama-Action数据集的经典使用场景主要集中在无人机视角下的人类行为检测。该数据集通过43个全标注的视频序列,涵盖了12种常见户外行为,如阅读、握手、饮水和搬运等。这些视频序列不仅捕捉了动态行为的变化,还包含了显著的尺度变化、视角变化以及多标签演员的复杂情况。因此,Okutama-Action数据集特别适用于开发和评估在真实世界无人机应用中的人类行为检测算法,尤其是在监控、搜索和救援等任务中。
解决学术问题
Okutama-Action数据集解决了当前行为检测数据集在真实世界无人机视角下代表性不足的问题。现有数据集往往缺乏动态行为过渡、显著的尺度变化和多标签演员等挑战,而这些在实际应用中是常见的。通过提供这些复杂场景的标注数据,Okutama-Action数据集推动了行为检测领域的发展,使得研究人员能够开发出更适应实际应用的算法。这不仅提高了学术研究的实用性,也为未来的技术进步奠定了基础。
实际应用
Okutama-Action数据集在实际应用中具有广泛的前景,特别是在无人机监控和搜索救援任务中。在监控任务中,能够识别和跟踪演员的行为对于检测异常情况至关重要。例如,在人群管理中,识别出异常行为可以及时采取措施。在搜索和救援任务中,能够区分一个人的行为可以帮助系统判断该人是否需要帮助,从而提高救援效率。此外,该数据集的高分辨率和长序列特性也使其在城市规划和环境监测等领域具有潜在应用价值。
数据集最近研究
最新研究方向
在无人机(UAV)广泛应用于监控、配送和搜救等任务的背景下,Okutama-Action数据集的最新研究方向主要集中在从空中视角进行并发人类行为检测。该数据集通过捕捉动态行为转换、显著的尺度变化、突发的摄像机移动以及多标签演员等挑战,推动了现实世界应用中行为检测模型的发展。研究者们正致力于开发能够处理多标签输出的深度学习模型,以应对数据集中复杂的行为标注。此外,评估多目标跟踪算法在该数据集上的表现,以应对现实世界中的挑战,也是当前研究的热点。
相关研究论文
  • 1
    Okutama-Action: An Aerial View Video Dataset for Concurrent Human Action Detection国家信息学研究所 · 2017年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作