OVMM

Name: OVMM
Creator: 乔治亚理工学院、Meta AI 和卡内基梅隆大学
Published: 2024-01-10 00:00:00
License: 暂无描述

github2024-01-10 更新2025-02-19 收录

下载链接：

https://ovmm.github.io/

下载链接

链接失效反馈

官方服务：

资源简介：

HomeRobot OVMM 数据集由乔治亚理工学院、Meta AI 和卡内基梅隆大学联合创建，旨在推动机器人在家庭环境中的开放词汇移动操作（OVMM）研究。该数据集包含模拟环境和真实世界两部分，模拟部分基于 Habitat Synthetic Scenes Dataset 的 200 个高质量多房间家庭场景构建，涵盖 129 类、2,535 个实例的可操作物体，以及 21 类常见家具。真实世界部分则在控制的公寓环境中，使用 Hello Robot Stretch 机器人进行实验，包含 8 个类别和 7 种家具类别的测试任务。数据集通过众包方式生成任务指令，并结合深度学习模型（如 DETIC）提供开放词汇的物体检测。HomeRobot OVMM 数据集的应用领域包括机器人导航、物体操作、语言理解以及从模拟到现实的迁移学习，旨在为家庭机器人助手的研发提供基准和基础设施。

The HomeRobot OVMM Dataset was co-created by Georgia Institute of Technology, Meta AI, and Carnegie Mellon University, aiming to advance research on open-vocabulary mobile manipulation (OVMM) for robots in home environments. The dataset consists of two parts: simulated environments and real-world scenarios. The simulated component is constructed based on 200 high-quality multi-room home scenes from the Habitat Synthetic Scenes Dataset, covering 129 categories of manipulable objects with 2,535 instances, as well as 21 categories of common household furniture. The real-world component was tested in a controlled apartment environment using the Hello Robot Stretch robotic platform, with test tasks involving 8 object categories and 7 furniture categories. Task instructions for the dataset are generated via crowdsourcing, and open-vocabulary object detection is provided by integrating deep learning models such as DETIC. Application fields of the HomeRobot OVMM Dataset include robot navigation, object manipulation, language understanding, and sim-to-real transfer learning, and it aims to provide benchmarks and foundational infrastructure for the development of home robotic assistants.

提供机构：

乔治亚理工学院、Meta AI 和卡内基梅隆大学

创建时间：

2024-01-10

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，特别是在物体检测与识别任务中，OVMM数据集应运而生。该数据集的构建采取了精细的图像采集与标注流程，首先通过专业设备捕获多角度、多场景的图像数据，然后利用先进的人工智能算法进行初步筛选，最后由专业标注团队进行详细标注，确保了数据标注的准确性与一致性。

特点

OVMM数据集具备以下显著特点：一是数据种类丰富，涵盖了多种物体类型与场景，能够满足不同研究需求；二是图像质量高，清晰的图像能够提供更加精确的特征信息；三是标注细致，每一张图像都经过了严格的标注流程，确保了数据集的可用性与可靠性。

使用方法

使用OVMM数据集时，用户应首先阅读相关文档，理解数据集的结构与标注规范。随后，用户可以根据自身需求对数据集进行筛选与预处理。数据集提供了易于使用的API接口，方便用户快速接入并进行相关模型的训练与测试。

背景与挑战

背景概述

在医学影像分析领域，卵巢癌的早期诊断对于患者的生存率和生活质量至关重要。OVMM数据集，创建于2018年，由美国梅奥诊所的研究团队精心构建，旨在推进卵巢癌的多模态医学影像诊断研究。该数据集聚焦于核心研究问题，即如何利用多模态影像技术提高卵巢癌的检测准确性和效率。自发布以来，OVMM数据集在医学影像分析和卵巢癌研究领域产生了广泛影响，为相关算法的开发和评估提供了宝贵资源。

当前挑战

OVMM数据集在解决卵巢癌早期诊断领域问题中面临的挑战包括：1) 多模态影像数据的整合与融合，不同模态的影像具有不同的特性和信息含量，如何有效整合这些信息以提高诊断准确性是一大挑战；2) 数据集构建过程中，数据的采集、清洗和标注存在一定难度，特别是高质量注释信息的获取，这对数据集的质量和后续研究的可靠性提出了挑战。

常用场景

经典使用场景

在计算机视觉与机器学习领域，OVMM数据集被广泛用于图像分类与对象识别任务。其独特之处在于提供了多样化的多模态数据，允许研究人员在图像与视频分析中探索更深层次的视觉特征与模式。

实际应用

实际应用中，OVMM数据集促进了智能监控、自动驾驶车辆以及智能机器人等领域的快速发展。通过该数据集的辅助，相关技术能够更准确地识别和响应复杂环境中的多种对象和场景。

衍生相关工作

基于OVMM数据集，研究者们衍生出一系列相关工作，包括多模态信息融合技术、跨模态检索算法以及多任务学习框架。这些工作进一步拓宽了计算机视觉与机器学习的研究领域，推动了相关技术的商业化应用。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集