five

ScanNet200|三维场景分割数据集|增量学习数据集

收藏
arXiv2025-02-25 更新2025-02-26 收录
三维场景分割
增量学习
下载链接:
https://github.com/vgthengane/CLIMB3D
下载链接
链接失效反馈
资源简介:
ScanNet200数据集包含了200个自然类别不平衡的3D场景。该数据集由穆罕默德·本·扎耶德人工智能大学创建,旨在为3D实例分割任务提供具有真实世界动态的增量学习场景。数据集涵盖了多种室内环境中的物体类别,如桌子、椅子、沙发、枕头等。通过设计基于类频率、语义相似性和随机分组的三个增量场景,以模拟新类别随时间连续出现并具有自然类别不平衡的实际世界情况。
提供机构:
英国萨里大学,阿联酋穆罕默德·本·扎耶德人工智能大学,澳大利亚国立大学
创建时间:
2025-02-25
AI搜集汇总
数据集介绍
main_image_url
构建方式
ScanNet200数据集的构建基于ScanNet的丰富室内场景数据,该数据集包括200个对象类别,并展现了自然的类别不平衡现象。为了模拟现实世界中的动态场景,数据集被设计为支持增量学习的设置,其中新类别随时间逐渐出现。数据集的构建考虑了不同类别的出现频率、语义相似性和随机分组,以反映现实世界中的多样性。这种设计使得ScanNet200成为一个理想的数据集,用于评估和开发能够处理类别不平衡和增量学习挑战的3D实例分割方法。
特点
ScanNet200数据集的特点在于其多样性和复杂性,旨在模拟现实世界中的动态场景。数据集包括200个类别,涵盖了室内环境中可能出现的各种对象。这种多样性使得数据集成为评估和开发能够处理类别不平衡和增量学习挑战的3D实例分割方法的一个理想选择。数据集的设计考虑了不同类别的出现频率、语义相似性和随机分组,以反映现实世界中的多样性。此外,数据集的增量学习设置使得模型能够在不断学习新类别的过程中保持对先前知识的记忆,从而避免灾难性遗忘。
使用方法
ScanNet200数据集的使用方法涉及将数据集分割成三个阶段,每个阶段引入一组新的类别。这种增量学习的设置允许模型在训练过程中逐步适应新类别的出现。为了评估模型在处理类别不平衡和增量学习挑战方面的性能,数据集还提供了三种不同的场景,包括基于频率的场景、基于语义相似性的场景和随机分组场景。这些场景旨在模拟现实世界中不同类别的出现方式和分布情况。用户可以使用这些场景来训练和测试他们的3D实例分割模型,并评估模型在处理类别不平衡和增量学习挑战方面的性能。
背景与挑战
背景概述
ScanNet200数据集是一个用于室内3D实例分割的丰富标注数据集,由英国萨里大学和阿拉伯联合酋长国穆罕默德·本·扎耶德人工智能大学的研究团队创建。该数据集包含200个类别,旨在模拟真实世界场景中逐渐出现新类别并具有自然类别不平衡的情况。ScanNet200数据集的创建是为了解决3D实例分割中存在的挑战,即如何有效地处理类别增量学习和类别不平衡问题。该数据集为评估模型在增量学习环境下的性能提供了基准,并对相关领域的研究产生了深远的影响。
当前挑战
ScanNet200数据集相关的挑战主要包括:1) 实际场景中类别增量学习的挑战,即如何适应新类别的出现并保留先前的知识,特别是对于罕见或低频类别;2) 构建过程中所遇到的挑战,例如如何处理数据集中存在的自然类别不平衡,以及如何在增量更新过程中平衡学习罕见类别。为了应对这些挑战,研究团队提出了CLIMB3D框架,该框架结合了示例重放、知识蒸馏和一种新的不平衡校正模块。实验结果表明,与基线相比,CLIMB3D框架在mAP方面提高了16.76%,有效地解决了类别增量学习和类别不平衡问题。
常用场景
经典使用场景
ScanNet200数据集广泛应用于室内场景下的3D实例分割任务。该数据集提供了丰富的室内场景点云数据,以及对应的实例分割标注,使得研究者能够在模拟真实环境中对3D实例分割算法进行评估和优化。ScanNet200数据集的经典使用场景包括:1) 评估和比较不同3D实例分割算法的性能;2) 训练和测试3D实例分割模型,以提高模型的准确性和鲁棒性;3) 研究和开发新的3D实例分割算法,以解决室内场景下的挑战性问题。
实际应用
ScanNet200数据集的实际应用场景包括:1) 室内机器人导航:通过3D实例分割,机器人可以识别和跟踪室内环境中的不同物体,从而实现自主导航和避障;2) 增强现实(AR)和虚拟现实(VR):3D实例分割可以用于创建室内场景的精确模型,从而支持AR和VR应用程序的开发;3) 室内设计:3D实例分割可以帮助设计师更好地理解室内空间,从而提高设计效率和准确性。
衍生相关工作
ScanNet200数据集衍生了多个相关的研究工作,包括:1) 基于ScanNet200数据集的类增量学习(CIL)框架的研究,如CLIMB-3D;2) 针对ScanNet200数据集的3D实例分割算法的改进,如Mask3D等;3) 利用ScanNet200数据集进行其他计算机视觉任务的研究,如3D语义分割、3D目标检测等。这些研究工作推动了3D实例分割领域的发展,并为室内场景下的计算机视觉应用提供了新的可能性。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

Amazon Product Data

该数据集包含亚马逊产品的详细信息,包括产品规格、价格、折扣、客户评价和用户评分等字段。

github 收录

DAT

DAT是一个统一的跨场景跨领域基准,用于开放世界无人机主动跟踪。它提供了24个视觉复杂的场景,以评估算法的跨场景和跨领域泛化能力,并具有高保真度的现实机器人动力学建模。

github 收录

Plant-Diseases

Dataset for Plant Diseases containg variours Plant Disease

kaggle 收录