Turin3D
收藏arXiv2025-04-08 更新2025-04-10 收录
下载链接:
https://huggingface.co/datasets/links_ads/Turin3D
下载链接
链接失效反馈官方服务:
资源简介:
Turin3D是一个覆盖意大利都灵市中心约1.43平方公里区域的新 aerial LiDAR数据集,包含大约7000万个点。该数据集由都灵理工大学和LINKS基金会联合收集,采用了Leica CityMapper-2传感器,并结合了激光雷达和航空影像技术进行三维重建。数据集分为训练、验证和测试三个子集,其中验证和测试集已经进行了人工标注,而训练集则保持未标注状态,以支持半监督和无监督学习算法的研究。该数据集对于户外点云分割研究具有重要价值,尤其是对于自监督和半监督学习方法的研究。
Turin3D is a novel aerial LiDAR dataset covering approximately 1.43 square kilometers of downtown Turin, Italy, and contains around 70 million points. Collected jointly by Politecnico di Torino and the LINKS Foundation using the Leica CityMapper-2 sensor, the dataset integrates LiDAR and aerial imagery technologies for 3D reconstruction. It is split into three subsets: training, validation, and test. The validation and test subsets have undergone manual annotation, while the training subset remains unannotated to support research on semi-supervised and unsupervised learning algorithms. This dataset holds substantial value for outdoor point cloud segmentation research, especially for studies focusing on self-supervised and semi-supervised learning approaches.
提供机构:
都灵理工大学, LINKS基金会, 罗马大学
创建时间:
2025-04-08
搜集汇总
数据集介绍

构建方式
Turin3D数据集通过Leica CityMapper-2传感器进行航空激光雷达(LiDAR)扫描,覆盖了意大利都灵市中心约1.43平方公里的区域,包含近7000万个点。数据采集过程中,LiDAR系统以1公里高度和20度扫描角运行,点密度为30-40点/平方米,确保了城市结构的详细几何重建。同时,通过航空影像补充了RGB信息,进一步丰富了数据集的多样性。数据集分为训练集、验证集和测试集,其中验证集和测试集经过人工标注,而训练集则保持未标注状态,以支持半监督学习研究。
特点
Turin3D数据集的特点在于其高分辨率的城市点云覆盖,涵盖了多样化的城市环境,包括住宅区、公园、河流和丘陵地形。数据集采用了六类语义标签(如土壤、植被、建筑物等),并排除了难以区分的类别,以提高标注的可靠性。此外,数据集的点云不仅包含几何坐标,还融合了RGB和强度信息,为语义分割任务提供了多模态特征。其独特的未标注训练集设计,使其成为研究半监督学习和域适应技术的理想基准。
使用方法
Turin3D数据集的使用方法主要包括两种实验范式:迁移学习和半监督学习。在迁移学习中,模型先在现有标注数据集上预训练,再在Turin3D的测试集上评估泛化能力。半监督学习则利用未标注训练集,通过迭代伪标签生成和自适应置信度阈值优化模型性能。研究推荐使用RandLA-Net等点云分割架构,并搭配几何与色彩增强策略。数据以LAS 1.4格式存储,支持直接加载到Open3D等框架进行训练和评估。
背景与挑战
背景概述
Turin3D数据集由意大利都灵理工大学和LINKS基金会的研究团队于2025年发布,旨在推动城市环境中基于航空LiDAR点云的3D语义分割研究。该数据集覆盖都灵市中心约1.43平方公里的区域,包含近7000万个高密度点云数据,采用Leica CityMapper-2混合传感器采集,融合了LiDAR扫描与航空影像技术。区别于地面LiDAR数据易受遮挡限制的特点,Turin3D通过航空视角完整捕捉了建筑屋顶、街道要素等城市立体结构,为城市数字孪生、基础设施监测等应用提供了重要数据支持。其创新性地采用半标注策略——仅对验证集和测试集进行人工标注,训练集保留未标注数据以促进自监督和半监督学习方法的研究。
当前挑战
Turin3D面临的挑战主要体现在两方面:领域问题层面,城市点云分割需解决几何结构复杂性(如建筑立面细节)、类别不平衡(如水域占比低)以及跨城市泛化(如不同地区建筑风格差异)等难题;数据构建层面,航空LiDAR点云的高噪声(特别是水面反射)、大规模数据标注成本(单点人工标注耗时)以及多模态数据对齐(LiDAR与RGB影像配准)构成主要障碍。该数据集特别突出了标注稀缺场景下的适应策略验证,其未标注训练集要求算法具备从伪标签中提取有效特征的能力,这对现有半监督学习方法的鲁棒性提出了更高要求。
常用场景
经典使用场景
Turin3D数据集在3D语义分割领域具有重要应用价值,特别是在城市建模和环境分析中。该数据集通过高分辨率的航空LiDAR点云数据,覆盖了都灵市中心约1.43平方公里的区域,包含近7000万个点。其经典使用场景包括城市基础设施监测、城市规划以及环境分析。由于数据集的点云密度高且覆盖范围广,研究人员可以借此进行大规模城市环境的详细建模和语义分割任务。
衍生相关工作
Turin3D数据集衍生了一系列经典研究工作,特别是在半监督学习和迁移学习领域。例如,研究人员基于该数据集提出了自适应置信度阈值方法,显著提升了模型在标签稀缺条件下的性能。此外,数据集还被用于评估Point Transformer和RandLA-Net等先进点云分割模型的泛化能力,推动了3D语义分割算法的进一步发展。
数据集最近研究
最新研究方向
Turin3D数据集作为新兴的城市LiDAR点云语义分割基准,其最新研究方向聚焦于半监督学习在标签稀缺场景下的适应性策略优化。随着数字孪生城市和智慧城市建设的加速推进,高精度三维语义分割技术成为实现基础设施智能监测、城市空间规划的核心支撑。该数据集通过引入未标注训练集与自适应置信度阈值伪标签迭代机制,为跨域迁移学习、自监督特征提取等前沿课题提供了实验平台。其1.43平方公里都心区覆盖密度达30-40点/平方米的航空LiDAR数据,弥补了现有开源数据集中密集城区高空视角标注样本的不足,特别在植被覆盖、水体识别等城市生态要素分析中展现出独特价值。
相关研究论文
- 1Turin3D: Evaluating Adaptation Strategies under Label Scarcity in Urban LiDAR Segmentation with Semi-Supervised Techniques都灵理工大学, LINKS基金会, 罗马大学 · 2025年
以上内容由遇见数据集搜集并总结生成



