ScanNet200|三维场景分割数据集|增量学习数据集

arXiv2025-02-25 更新2025-02-26 收录

三维场景分割

增量学习

下载链接：

https://github.com/vgthengane/CLIMB3D

下载链接

链接失效反馈

资源简介：

ScanNet200数据集包含了200个自然类别不平衡的3D场景。该数据集由穆罕默德·本·扎耶德人工智能大学创建，旨在为3D实例分割任务提供具有真实世界动态的增量学习场景。数据集涵盖了多种室内环境中的物体类别，如桌子、椅子、沙发、枕头等。通过设计基于类频率、语义相似性和随机分组的三个增量场景，以模拟新类别随时间连续出现并具有自然类别不平衡的实际世界情况。

提供机构：

英国萨里大学，阿联酋穆罕默德·本·扎耶德人工智能大学，澳大利亚国立大学

创建时间：

2025-02-25

AI搜集汇总

数据集介绍

构建方式

ScanNet200数据集的构建基于ScanNet的丰富室内场景数据，该数据集包括200个对象类别，并展现了自然的类别不平衡现象。为了模拟现实世界中的动态场景，数据集被设计为支持增量学习的设置，其中新类别随时间逐渐出现。数据集的构建考虑了不同类别的出现频率、语义相似性和随机分组，以反映现实世界中的多样性。这种设计使得ScanNet200成为一个理想的数据集，用于评估和开发能够处理类别不平衡和增量学习挑战的3D实例分割方法。

特点

ScanNet200数据集的特点在于其多样性和复杂性，旨在模拟现实世界中的动态场景。数据集包括200个类别，涵盖了室内环境中可能出现的各种对象。这种多样性使得数据集成为评估和开发能够处理类别不平衡和增量学习挑战的3D实例分割方法的一个理想选择。数据集的设计考虑了不同类别的出现频率、语义相似性和随机分组，以反映现实世界中的多样性。此外，数据集的增量学习设置使得模型能够在不断学习新类别的过程中保持对先前知识的记忆，从而避免灾难性遗忘。

使用方法

ScanNet200数据集的使用方法涉及将数据集分割成三个阶段，每个阶段引入一组新的类别。这种增量学习的设置允许模型在训练过程中逐步适应新类别的出现。为了评估模型在处理类别不平衡和增量学习挑战方面的性能，数据集还提供了三种不同的场景，包括基于频率的场景、基于语义相似性的场景和随机分组场景。这些场景旨在模拟现实世界中不同类别的出现方式和分布情况。用户可以使用这些场景来训练和测试他们的3D实例分割模型，并评估模型在处理类别不平衡和增量学习挑战方面的性能。

背景与挑战

背景概述

ScanNet200数据集是一个用于室内3D实例分割的丰富标注数据集，由英国萨里大学和阿拉伯联合酋长国穆罕默德·本·扎耶德人工智能大学的研究团队创建。该数据集包含200个类别，旨在模拟真实世界场景中逐渐出现新类别并具有自然类别不平衡的情况。ScanNet200数据集的创建是为了解决3D实例分割中存在的挑战，即如何有效地处理类别增量学习和类别不平衡问题。该数据集为评估模型在增量学习环境下的性能提供了基准，并对相关领域的研究产生了深远的影响。

当前挑战

ScanNet200数据集相关的挑战主要包括：1) 实际场景中类别增量学习的挑战，即如何适应新类别的出现并保留先前的知识，特别是对于罕见或低频类别；2) 构建过程中所遇到的挑战，例如如何处理数据集中存在的自然类别不平衡，以及如何在增量更新过程中平衡学习罕见类别。为了应对这些挑战，研究团队提出了CLIMB3D框架，该框架结合了示例重放、知识蒸馏和一种新的不平衡校正模块。实验结果表明，与基线相比，CLIMB3D框架在mAP方面提高了16.76%，有效地解决了类别增量学习和类别不平衡问题。

常用场景

经典使用场景

ScanNet200数据集广泛应用于室内场景下的3D实例分割任务。该数据集提供了丰富的室内场景点云数据，以及对应的实例分割标注，使得研究者能够在模拟真实环境中对3D实例分割算法进行评估和优化。ScanNet200数据集的经典使用场景包括：1) 评估和比较不同3D实例分割算法的性能；2) 训练和测试3D实例分割模型，以提高模型的准确性和鲁棒性；3) 研究和开发新的3D实例分割算法，以解决室内场景下的挑战性问题。

实际应用

ScanNet200数据集的实际应用场景包括：1) 室内机器人导航：通过3D实例分割，机器人可以识别和跟踪室内环境中的不同物体，从而实现自主导航和避障；2) 增强现实（AR）和虚拟现实（VR）：3D实例分割可以用于创建室内场景的精确模型，从而支持AR和VR应用程序的开发；3) 室内设计：3D实例分割可以帮助设计师更好地理解室内空间，从而提高设计效率和准确性。

衍生相关工作

ScanNet200数据集衍生了多个相关的研究工作，包括：1) 基于ScanNet200数据集的类增量学习（CIL）框架的研究，如CLIMB-3D；2) 针对ScanNet200数据集的3D实例分割算法的改进，如Mask3D等；3) 利用ScanNet200数据集进行其他计算机视觉任务的研究，如3D语义分割、3D目标检测等。这些研究工作推动了3D实例分割领域的发展，并为室内场景下的计算机视觉应用提供了新的可能性。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像，每张图像均给出对应的人名，共有5749人，且绝大部分人仅有一张图片。每张图片的尺寸为250X250，绝大部分为彩色图像，但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据，包括日照时间、降雨量、温度、风速等关键数据。通过这些数据，可以深入了解气象现象对不同地区的影响，并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

中国空气质量数据集（2014-2020年）

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI，包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台，每日更新。数据集的原始文件为CSV的文本记录，通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心收录

中国交通事故深度调查（CIDAS）数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息，以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例，单个案例信息包含人、车、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征，探索事故预防和损伤防护措施的关键数据源，为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心收录

GME Data

关于2021年GameStop股票活动的数据，包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录