five

MITO|毫米波成像数据集|计算机视觉数据集

收藏
arXiv2025-02-15 更新2025-02-18 收录
毫米波成像
计算机视觉
下载链接:
https://github.com/signalkinetics/MITO
下载链接
链接失效反馈
资源简介:
MITO数据集是由麻省理工学院创建的,包含多种日常物体的多光谱毫米波图像。该数据集利用机器人臂上的毫米波雷达捕获了超过580个真实世界的3D毫米波图像,这些图像来源于76个不同的物体,既有视线内也有视线外的场景。数据集还包括相应的RGB-D图像和地面真实分割掩模,以及一个开源的仿真工具,可用于生成任意3D三角形网格的合成毫米波图像。MITO旨在推动计算机视觉研究者开发基于毫米波的非视线感知算法和模型。
提供机构:
麻省理工学院
创建时间:
2025-02-15
AI搜集汇总
数据集介绍
main_image_url
构建方式
MITO数据集的构建采用了先进的机器人成像系统,该系统由一个UR5机械臂、两个工作在不同频率的毫米波雷达以及一个RGB-D相机组成。通过一个雷达信号处理流程,数据集收集了超过580个真实世界的3D毫米波图像,这些图像来自于YCB数据集中的76个不同物体。每个物体都提供了在视线内和非视线内的真实世界毫米波图像,以及RGB-D图像和地面实况分割掩膜。此外,还开发了一个开源的仿真工具,可用于为任何3D三角形网格生成合成毫米波图像。
特点
MITO数据集的特点在于其真实世界数据的多光谱性,提供了在不同频率下的毫米波图像,这允许研究人员探索分辨率与穿透障碍物能力之间的权衡。数据集包含了视线内和非视线内的图像,以及RGB-D图像和分割掩膜,为计算机视觉研究人员提供了丰富的数据资源。此外,数据集还包括一个开源的仿真工具,可以生成合成的毫米波图像,这有助于扩大数据集规模并促进模型训练。
使用方法
MITO数据集的使用方法包括直接使用收集到的真实世界毫米波图像进行研究和开发,以及使用开源仿真工具生成合成图像。研究人员可以利用这些数据集进行毫米波图像分割、分类等计算机视觉任务,以开发非视线感知算法和模型。数据集还包括用于下载、处理数据和可视化图像的Python和CUDA脚本,使得使用过程更加便捷。
背景与挑战
背景概述
随着计算机视觉的快速发展,对于机器人操作和感知的需求日益增长。然而,现有的光学感知系统(如相机、激光雷达等)受限于视线范围,难以在遮挡环境中工作。毫米波(mmWave)雷达因其能够穿透日常遮挡物(如纸箱、织物、塑料等)的特性,为非视线感知提供了可能。MITO数据集的创建旨在解决这一领域难题,为计算机视觉研究人员提供多光谱mmWave图像数据,推动非视线感知算法和模型的发展。MITO数据集由麻省理工学院(MIT)的研究团队于2025年创建,包含76个来自YCB数据集的日常物体在视线和非视线条件下的mmWave图像,以及相应的RGB-D图像和地面真实分割掩码。此外,MITO还提供了一个开源的模拟工具,可用于生成任意3D三角形网格的合成mmWave图像,为模型训练提供更多数据。
当前挑战
MITO数据集和相关模拟工具的创建面临了多个挑战。首先,现有的mmWave图像数据稀缺,且收集和处理mmWave信号具有跨学科性,导致计算机视觉研究人员难以开发基于mmWave的非视线感知算法和模型。其次,mmWave图像与可见光图像在多个方面存在本质差异,如雷达特有的伪影、无颜色信息和复数特性,需要新的算法或模型来适应非视线感知。此外,如何准确模拟不同材料的mmWave信号反射特性也是一个挑战。为了解决这些挑战,MITO数据集提供了多光谱mmWave图像,以及开源的模拟工具,为研究人员提供更多数据和工具支持。同时,MITO还展示了两个计算机视觉任务,即mmWave图像的目标分割和分类,证明了数据集和模拟工具的有效性。
常用场景
经典使用场景
MITO数据集的经典使用场景是通过毫米波(mmWave)雷达技术实现对日常物体的非视距(NLOS)感知。该数据集包含了在视距(LOS)和非视距条件下,使用24GHz和77GHz两种不同频率的毫米波雷达获取的超过580张真实世界物体的三维图像。这些图像与RGB-D相机捕获的图像以及地面真实分割掩码相结合,为计算机视觉研究人员提供了开发非视距感知算法和模型的宝贵资源。
实际应用
MITO数据集的实际应用场景广泛,包括但不限于:1. 机器人操作和感知:通过毫米波雷达,机器人能够在非视距条件下识别和操作物体,例如从封闭的盒子中取出物品,或者在复杂的仓储环境中导航。2. 安全监控:毫米波雷达可以穿透墙壁、烟雾等障碍物,实现隐蔽目标检测,例如机场安检、边境巡逻等。3. 医疗成像:毫米波成像技术可以用于体内器官的成像,例如乳腺成像、血管成像等。4. 汽车自动驾驶:毫米波雷达可以用于车辆周围环境的感知,例如车辆检测、行人检测等。
衍生相关工作
MITO数据集的发布引发了大量相关研究,推动了非视距感知领域的发展。例如,研究人员利用MITO数据集训练了能够实现毫米波图像分割和分类的深度学习模型,这些模型在真实世界场景中取得了较高的准确率。此外,MITO数据集还促进了毫米波成像仿真技术的发展,研究人员开发了一系列开源的毫米波成像仿真工具,这些工具可以帮助研究人员快速生成大量的毫米波图像数据,用于模型的训练和评估。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

UAVDT

UAVDT数据集由中国科学院大学等机构创建,包含约80,000帧从10小时无人机拍摄视频中精选的图像,覆盖多种复杂城市环境。数据集主要关注车辆目标,每帧均标注了边界框及多达14种属性,如天气条件、飞行高度、相机视角等。该数据集旨在推动无人机视觉技术在不受限制场景下的研究,解决高密度、小目标、相机运动等挑战,适用于物体检测、单目标跟踪和多目标跟踪等基础视觉任务。

arXiv 收录

poi

本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。

github 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

中亚主要国家的原油资源的储量、产量、消费量及其占世界比重(1985-2016)

中亚五国中,石油资源主要分布在哈萨克斯坦、乌兹别克斯坦、土库曼斯坦三个国家。根据BP世界能源统计年鉴,经整理、抽取、计算和汇总后,形成中亚主要国家(哈萨克斯坦、乌兹别克斯坦、土库曼斯坦)原油资源的储量、产量、消费量及其占世界比重的统计表。 主要指标包括: (1)储量,1991-2016年,单位:百万吨 (2)产量,1985-2016年,单位:百万吨 (3)储产比,1991-2016年,单位:百万吨 (4)消费量,1985-2016年,单位:百万吨 (5)产消差额,1985-2016年,单位:百万吨 此外,以上数据均包括中亚地区的哈萨克斯坦、乌兹别克斯坦、土库曼斯坦、三国汇总以及世界总量的情况。

地球大数据科学工程 收录

Agricultural Pests Dataset

Agricultural Pests Classification

kaggle 收录