TUL-Poland/InLUT3D
收藏Hugging Face2024-10-23 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/TUL-Poland/InLUT3D
下载链接
链接失效反馈官方服务:
资源简介:
InLUT3D数据集是一个专门用于真实物体分类以及语义和实例分割任务的点云数据集。数据集包含321个扫描,使用Leica BLK360扫描仪捕获。点云数据被分为18个不同的类别,每个类别在label.yaml文件中都有相应的代码和颜色。数据集面临的主要挑战包括类别分布不均、虚拟图像的存在、扫描阴影导致的数据缺失以及高密度点云。数据集的结构包括多个setup文件夹,每个文件夹包含投影图、分割图和点云数据文件。点云数据的特征包括XYZ坐标、RGB颜色、类别代码和实例ID。
The InLUT3D dataset is a point cloud dataset tailored for real object classification and both semantic and instance segmentation tasks. It comprises 321 scans captured using the Leica BLK360 scanner. The points are divided into 18 distinct categories, each with corresponding codes and colors in the label.yaml file. The dataset faces several challenges, including extremely non-uniform category distribution, presence of virtual images, missing data due to scanning shadows, and high point density. The dataset structure includes multiple setup folders, each containing projection images, segmentation images, and point cloud data files. The point cloud data features include XYZ coordinates, RGB colors, category codes, and instance IDs.
提供机构:
TUL-Poland
搜集汇总
数据集介绍

构建方式
InLUT3D数据集由罗兹工业大学构建,旨在服务于真实物体分类及语义与实例分割任务。该数据集包含321次扫描,部分区域被多次覆盖,所有数据均采用Leica BLK360扫描仪采集。点云以PTS文本格式存储,每个扫描点包含XYZ坐标、RGB颜色值、类别编码及实例ID共八个属性。数据组织上,每个扫描场景对应一个独立文件夹,内含球形投影图、分割标注图及点云文件,结构清晰,便于直接加载与处理。
特点
该数据集涵盖天花板、地板、墙壁、楼梯、柱子、椅子、沙发、桌子等18个精细类别,标注丰富且区分明确。其显著特点在于类别分布极不均匀,存在严重的类别不平衡挑战;同时,由于反射表面引入虚拟影像及窗外数据干扰,加之扫描阴影导致部分区域缺失,增加了数据复杂性。此外,点云密度极高,为高精度三维理解任务提供了丰富细节,但也对算法鲁棒性提出了更高要求。
使用方法
使用InLUT3D时,可直接解压tar.gz压缩包,按场景文件夹读取PTS文件。每行数据包含XYZ坐标、RGB颜色及语义与实例标签,适合直接用于点云分类、语义分割及实例分割模型的训练与评估。建议结合点云处理库(如Open3D或PyTorch3D)进行数据加载与预处理,针对类别不平衡问题可引入重采样或加权损失函数。数据集适用于室内场景理解研究,尤其适合验证算法在非均匀分布与噪声环境下的性能。
背景与挑战
背景概述
随着三维视觉与激光雷达技术的飞速发展,点云数据在室内场景理解中扮演着愈发关键的角色,然而现有数据集多聚焦于城市场景或小型物体,针对复杂室内环境的高精度标注资源仍显匮乏。在此背景下,罗兹理工大学(Lodz University of Technology)的研究团队于近年推出了InLUT3D数据集,旨在为室内点云的物体分类、语义分割及实例分割任务提供标准化基准。该数据集包含321次扫描,覆盖了多个室内区域,部分场景由多次扫描构成,所有数据均采用Leica BLK360扫描仪采集,确保了点云的高密度与几何精度。InLUT3D的发布填补了室内多类别点云标注数据的空白,其18个精细类别(如天花板、墙壁、家具、设备等)为算法在真实室内环境中的泛化能力评估提供了有力支撑,对推动智能建筑、机器人导航及增强现实等领域的进步具有重要学术价值。
当前挑战
InLUT3D数据集面临多重固有挑战。首先,类别分布极度不均衡,部分常见类别(如墙壁、地板)占据绝大多数点云,而植物、盘子等稀有类别的样本稀少,易导致模型在训练中产生偏差。其次,扫描过程中反射表面(如玻璃、镜面)会产生虚拟影像,同时门窗外的外部数据也被纳入点云,这些噪声干扰了纯净室内场景的提取。再者,由于扫描阴影的存在,激光束无法触及某些区域,导致数据缺失,形成不完整的几何结构。此外,整个数据集具有极高的点密度,尽管有利于细节捕捉,却对计算资源与处理效率提出了严峻考验,增加了模型在实时应用中的部署难度。
常用场景
经典使用场景
InLUT3D数据集作为面向室内三维点云理解的核心资源,其最经典的用途在于支撑真实物体分类与语义、实例分割任务的模型研发与性能评估。该数据集收录了321次扫描数据,涵盖天花板、地板、墙壁、家具、设备等18个精细类别,并提供了点云坐标、颜色、类别编码及实例标识等多维特征。研究者常利用其高密度点云和跨区域多次扫描的特性,训练与验证深度学习模型在复杂室内环境下的泛化能力,尤其适合评估算法对非均匀类别分布、反射伪影及扫描阴影等现实挑战的鲁棒性。
实际应用
在实际应用层面,InLUT3D数据集为建筑信息建模、室内导航与机器人自主作业等提供了关键支撑。例如,基于该数据集训练的语义分割模型能够自动识别室内结构元素与物体,助力数字孪生场景的自动化构建;实例分割能力则赋能服务机器人对桌椅、门窗等个体进行精准定位与操作规划。此外,其在文化遗产数字化保护及室内设施管理领域亦展现出潜力,通过点云分类快速提取建筑构件与设备信息,有效降低了人工标注成本并提升了三维重建的智能化水平。
衍生相关工作
InLUT3D数据集的发布催生了一系列围绕点云高效处理与鲁棒学习的衍生产出。研究者基于其多扫描覆盖的特性,探索了跨视角点云配准与融合方法,以缓解单次扫描的数据缺失问题。同时,针对其非均衡类别分布,涌现出基于重采样、损失函数优化或生成式数据增强的长尾分割技术。此外,结合其高密度点云与色彩信息,相关工作进一步拓展至联合几何与外观特征的室内场景解析,以及面向反射伪影抑制的点云去噪网络设计,形成了以InLUT3D为基准的室内三维理解研究脉络。
以上内容由遇见数据集搜集并总结生成



