five

MECCANO

收藏
arXiv2020-10-12 更新2024-06-21 收录
下载链接:
https://iplab.dmi.unict.it/MECCANO
下载链接
链接失效反馈
官方服务:
资源简介:
MECCANO数据集是首个专注于工业类似环境中第一人称视角下人类-物体交互的研究数据集。该数据集由20名参与者在模拟工业场景中构建摩托车玩具模型的视频组成,包含299,376帧视频数据。数据集不仅标注了时间上的动作片段,还标注了空间上的活跃物体边界框,涵盖了12种动词、20种名词和61种独特动作的分类。MECCANO数据集旨在推动工业环境中第一人称视角下人类动作识别、活跃物体检测、活跃物体识别及第一人称视角下人类-物体交互检测等任务的研究。

The MECCANO dataset is the first research dataset focused on human-object interactions from a first-person perspective in industrial-like environments. It consists of videos of 20 participants assembling a toy motorcycle model in a simulated industrial scenario, totaling 299,376 video frames. The dataset not only annotates temporal action segments but also spatial bounding boxes of active objects, covering 12 verb categories, 20 noun categories and 61 unique action categories. The MECCANO dataset aims to advance research on tasks such as first-person human action recognition, active object detection, active object recognition and first-person human-object interaction detection in industrial environments.
提供机构:
IPLAB, University of Catania
创建时间:
2020-10-12
搜集汇总
数据集介绍
main_image_url
构建方式
MECCANO数据集是通过20名参与者构建摩托车模型的过程来收集的。参与者需要与各种组件和工具进行交互,如螺丝刀和扳手,以及小物件如螺丝和螺栓。数据集在时间和空间上进行了标注,包括动作片段和参与交互的物体的边界框。这种构建方式模拟了工业环境中的操作,尽管简化了实际工业场景的复杂性,但仍足以展现其挑战性。
特点
MECCANO数据集的特点在于其独特的工业场景和详尽的标注。它包含了时间上的动作片段标注和空间上的活动物体边界框标注,使得数据集能够支持动作识别、活动物体检测、活动物体识别以及自传式人-物体交互检测等任务。此外,数据集的动作类别和物体类别分布呈现长尾分布,反映了工业场景的复杂性。
使用方法
MECCANO数据集的使用方法包括四个主要任务:动作识别、活动物体检测、活动物体识别和自传式人-物体交互检测。对于动作识别,可以使用SlowFast、I3D和2D CNN等网络进行评估。活动物体检测可以使用基于Faster-RCNN的Hand-Object Detector模型,并根据数据集的特点进行调整。活动物体识别同样使用Faster-RCNN模型,并保留物体类别信息。自传式人-物体交互检测可以使用SlowFast网络结合Faster-RCNN模型,或使用InteractNet模型及其上下文增强版本进行评估。
背景与挑战
背景概述
MECCANO数据集是一个专注于研究工业环境中人类与物体交互的egocentric视频数据集。该数据集由意大利卡塔尼亚大学IPLAB实验室和XGD-XENIA s.r.l.公司的研究人员Francesco Ragusa、Salvatore Livatino、Antonino Furnari和Giovanni Maria Farinella于2020年创建。MECCANO数据集旨在填补工业环境中egocentric视角下人类与物体交互研究的空白,这对于提升工业环境中的工人安全、实施节能政策和优化生产流程具有重要意义。MECCANO数据集的创建为相关领域的研究提供了宝贵的资源,对推动egocentric视角下人类行为理解技术的发展产生了积极影响。
当前挑战
MECCANO数据集面临的主要挑战包括:1) 解决领域问题:该数据集旨在解决egocentric视角下工业环境中人类与物体交互识别的问题,这在之前的研究中较少涉及。2) 构建过程中的挑战:在工业环境中进行数据采集面临隐私问题和保护工业秘密的困难。为了克服这些限制,研究人员采用了模拟工业环境的场景,让参与者组装摩托车模型,以收集人类与物体交互的数据。此外,MECCANO数据集还面临标注过程中对时间(动作片段)和空间(活动物体边界框)的密集标注的挑战,以及对多种任务(包括动作识别、活动物体检测、活动物体识别和egocentric人类-物体交互检测)的标注和评估。
常用场景
经典使用场景
MECCANO数据集主要应用于工业环境中人类与物体交互行为的理解与分析。该数据集收集了参与者在构建摩托车模型时的第一人称视角视频,并对视频中的交互行为进行了详细标注,包括时间上的动作片段和空间上的物体边界框。这使得MECCANO数据集成为了研究工业场景下第一人称视角下人类与物体交互行为的重要资源。
解决学术问题
MECCANO数据集解决了在工业环境中研究人类与物体交互行为的难题。由于隐私问题和保护工业秘密的需要,在工业领域进行数据收集一直是一个挑战。MECCANO数据集通过在工业环境中构建摩托车模型这一简化场景,成功收集了大量的交互行为数据,为相关研究提供了有力支持。此外,MECCANO数据集还定义了第一人称视角下的人类与物体交互检测(EHOI)任务,为该领域的研究提供了新的方向。
衍生相关工作
MECCANO数据集的提出和公开,为相关领域的研究提供了重要的数据支持,并衍生了一系列经典工作。例如,MECCANO数据集被用于研究第一人称视角下的动作识别、主动物体检测、主动物体识别和EHOI检测等任务。这些研究不仅验证了MECCANO数据集的有效性,也为相关领域的研究提供了新的思路和方法。此外,MECCANO数据集还为其他领域的研究提供了启示,例如在智能监控、智能辅助系统等领域的研究中,可以借鉴MECCANO数据集的构建方法和标注方式,提高研究的质量和效果。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作