five

OVMM

收藏
github2024-01-10 更新2025-02-19 收录
下载链接:
https://ovmm.github.io/
下载链接
链接失效反馈
官方服务:
资源简介:
HomeRobot OVMM 数据集由乔治亚理工学院、Meta AI 和卡内基梅隆大学联合创建,旨在推动机器人在家庭环境中的开放词汇移动操作(OVMM)研究。该数据集包含模拟环境和真实世界两部分,模拟部分基于 Habitat Synthetic Scenes Dataset 的 200 个高质量多房间家庭场景构建,涵盖 129 类、2,535 个实例的可操作物体,以及 21 类常见家具。真实世界部分则在控制的公寓环境中,使用 Hello Robot Stretch 机器人进行实验,包含 8 个类别和 7 种家具类别的测试任务。数据集通过众包方式生成任务指令,并结合深度学习模型(如 DETIC)提供开放词汇的物体检测。HomeRobot OVMM 数据集的应用领域包括机器人导航、物体操作、语言理解以及从模拟到现实的迁移学习,旨在为家庭机器人助手的研发提供基准和基础设施。

The HomeRobot OVMM Dataset was co-created by Georgia Institute of Technology, Meta AI, and Carnegie Mellon University, aiming to advance research on open-vocabulary mobile manipulation (OVMM) for robots in home environments. The dataset consists of two parts: simulated environments and real-world scenarios. The simulated component is constructed based on 200 high-quality multi-room home scenes from the Habitat Synthetic Scenes Dataset, covering 129 categories of manipulable objects with 2,535 instances, as well as 21 categories of common household furniture. The real-world component was tested in a controlled apartment environment using the Hello Robot Stretch robotic platform, with test tasks involving 8 object categories and 7 furniture categories. Task instructions for the dataset are generated via crowdsourcing, and open-vocabulary object detection is provided by integrating deep learning models such as DETIC. Application fields of the HomeRobot OVMM Dataset include robot navigation, object manipulation, language understanding, and sim-to-real transfer learning, and it aims to provide benchmarks and foundational infrastructure for the development of home robotic assistants.
提供机构:
乔治亚理工学院、Meta AI 和卡内基梅隆大学
创建时间:
2024-01-10
搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉领域,特别是在物体检测与识别任务中,OVMM数据集应运而生。该数据集的构建采取了精细的图像采集与标注流程,首先通过专业设备捕获多角度、多场景的图像数据,然后利用先进的人工智能算法进行初步筛选,最后由专业标注团队进行详细标注,确保了数据标注的准确性与一致性。
特点
OVMM数据集具备以下显著特点:一是数据种类丰富,涵盖了多种物体类型与场景,能够满足不同研究需求;二是图像质量高,清晰的图像能够提供更加精确的特征信息;三是标注细致,每一张图像都经过了严格的标注流程,确保了数据集的可用性与可靠性。
使用方法
使用OVMM数据集时,用户应首先阅读相关文档,理解数据集的结构与标注规范。随后,用户可以根据自身需求对数据集进行筛选与预处理。数据集提供了易于使用的API接口,方便用户快速接入并进行相关模型的训练与测试。
背景与挑战
背景概述
在医学影像分析领域,卵巢癌的早期诊断对于患者的生存率和生活质量至关重要。OVMM数据集,创建于2018年,由美国梅奥诊所的研究团队精心构建,旨在推进卵巢癌的多模态医学影像诊断研究。该数据集聚焦于核心研究问题,即如何利用多模态影像技术提高卵巢癌的检测准确性和效率。自发布以来,OVMM数据集在医学影像分析和卵巢癌研究领域产生了广泛影响,为相关算法的开发和评估提供了宝贵资源。
当前挑战
OVMM数据集在解决卵巢癌早期诊断领域问题中面临的挑战包括:1) 多模态影像数据的整合与融合,不同模态的影像具有不同的特性和信息含量,如何有效整合这些信息以提高诊断准确性是一大挑战;2) 数据集构建过程中,数据的采集、清洗和标注存在一定难度,特别是高质量注释信息的获取,这对数据集的质量和后续研究的可靠性提出了挑战。
常用场景
经典使用场景
在计算机视觉与机器学习领域,OVMM数据集被广泛用于图像分类与对象识别任务。其独特之处在于提供了多样化的多模态数据,允许研究人员在图像与视频分析中探索更深层次的视觉特征与模式。
实际应用
实际应用中,OVMM数据集促进了智能监控、自动驾驶车辆以及智能机器人等领域的快速发展。通过该数据集的辅助,相关技术能够更准确地识别和响应复杂环境中的多种对象和场景。
衍生相关工作
基于OVMM数据集,研究者们衍生出一系列相关工作,包括多模态信息融合技术、跨模态检索算法以及多任务学习框架。这些工作进一步拓宽了计算机视觉与机器学习的研究领域,推动了相关技术的商业化应用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作