five

MECCANO|工业环境数据集|第一人称视角数据集

收藏
arXiv2020-10-12 更新2024-06-21 收录
工业环境
第一人称视角
下载链接:
https://iplab.dmi.unict.it/MECCANO
下载链接
链接失效反馈
资源简介:
MECCANO数据集是首个专注于工业类似环境中第一人称视角下人类-物体交互的研究数据集。该数据集由20名参与者在模拟工业场景中构建摩托车玩具模型的视频组成,包含299,376帧视频数据。数据集不仅标注了时间上的动作片段,还标注了空间上的活跃物体边界框,涵盖了12种动词、20种名词和61种独特动作的分类。MECCANO数据集旨在推动工业环境中第一人称视角下人类动作识别、活跃物体检测、活跃物体识别及第一人称视角下人类-物体交互检测等任务的研究。
提供机构:
IPLAB, University of Catania
创建时间:
2020-10-12
AI搜集汇总
数据集介绍
main_image_url
构建方式
MECCANO数据集是通过20名参与者构建摩托车模型的过程来收集的。参与者需要与各种组件和工具进行交互,如螺丝刀和扳手,以及小物件如螺丝和螺栓。数据集在时间和空间上进行了标注,包括动作片段和参与交互的物体的边界框。这种构建方式模拟了工业环境中的操作,尽管简化了实际工业场景的复杂性,但仍足以展现其挑战性。
特点
MECCANO数据集的特点在于其独特的工业场景和详尽的标注。它包含了时间上的动作片段标注和空间上的活动物体边界框标注,使得数据集能够支持动作识别、活动物体检测、活动物体识别以及自传式人-物体交互检测等任务。此外,数据集的动作类别和物体类别分布呈现长尾分布,反映了工业场景的复杂性。
使用方法
MECCANO数据集的使用方法包括四个主要任务:动作识别、活动物体检测、活动物体识别和自传式人-物体交互检测。对于动作识别,可以使用SlowFast、I3D和2D CNN等网络进行评估。活动物体检测可以使用基于Faster-RCNN的Hand-Object Detector模型,并根据数据集的特点进行调整。活动物体识别同样使用Faster-RCNN模型,并保留物体类别信息。自传式人-物体交互检测可以使用SlowFast网络结合Faster-RCNN模型,或使用InteractNet模型及其上下文增强版本进行评估。
背景与挑战
背景概述
MECCANO数据集是一个专注于研究工业环境中人类与物体交互的egocentric视频数据集。该数据集由意大利卡塔尼亚大学IPLAB实验室和XGD-XENIA s.r.l.公司的研究人员Francesco Ragusa、Salvatore Livatino、Antonino Furnari和Giovanni Maria Farinella于2020年创建。MECCANO数据集旨在填补工业环境中egocentric视角下人类与物体交互研究的空白,这对于提升工业环境中的工人安全、实施节能政策和优化生产流程具有重要意义。MECCANO数据集的创建为相关领域的研究提供了宝贵的资源,对推动egocentric视角下人类行为理解技术的发展产生了积极影响。
当前挑战
MECCANO数据集面临的主要挑战包括:1) 解决领域问题:该数据集旨在解决egocentric视角下工业环境中人类与物体交互识别的问题,这在之前的研究中较少涉及。2) 构建过程中的挑战:在工业环境中进行数据采集面临隐私问题和保护工业秘密的困难。为了克服这些限制,研究人员采用了模拟工业环境的场景,让参与者组装摩托车模型,以收集人类与物体交互的数据。此外,MECCANO数据集还面临标注过程中对时间(动作片段)和空间(活动物体边界框)的密集标注的挑战,以及对多种任务(包括动作识别、活动物体检测、活动物体识别和egocentric人类-物体交互检测)的标注和评估。
常用场景
经典使用场景
MECCANO数据集主要应用于工业环境中人类与物体交互行为的理解与分析。该数据集收集了参与者在构建摩托车模型时的第一人称视角视频,并对视频中的交互行为进行了详细标注,包括时间上的动作片段和空间上的物体边界框。这使得MECCANO数据集成为了研究工业场景下第一人称视角下人类与物体交互行为的重要资源。
解决学术问题
MECCANO数据集解决了在工业环境中研究人类与物体交互行为的难题。由于隐私问题和保护工业秘密的需要,在工业领域进行数据收集一直是一个挑战。MECCANO数据集通过在工业环境中构建摩托车模型这一简化场景,成功收集了大量的交互行为数据,为相关研究提供了有力支持。此外,MECCANO数据集还定义了第一人称视角下的人类与物体交互检测(EHOI)任务,为该领域的研究提供了新的方向。
衍生相关工作
MECCANO数据集的提出和公开,为相关领域的研究提供了重要的数据支持,并衍生了一系列经典工作。例如,MECCANO数据集被用于研究第一人称视角下的动作识别、主动物体检测、主动物体识别和EHOI检测等任务。这些研究不仅验证了MECCANO数据集的有效性,也为相关领域的研究提供了新的思路和方法。此外,MECCANO数据集还为其他领域的研究提供了启示,例如在智能监控、智能辅助系统等领域的研究中,可以借鉴MECCANO数据集的构建方法和标注方式,提高研究的质量和效果。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

VisDrone2019

VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。

github 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

A00_13081a.jpg

Link to OCHRE database: http://pi.lib.uchicago.edu/1001/org/ochre/a8598ac4-9093-d548-30f3-84ce2ec953a7

DataONE 收录

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录