GridNet-HD
收藏Hugging Face2025-05-01 更新2025-05-02 收录
下载链接:
https://huggingface.co/datasets/heig-vd-geo/GridNet-HD
下载链接
链接失效反馈官方服务:
资源简介:
GridNet-HD数据集是一个用于电力基础设施3D语义分割任务的数据集,包含图像和3D点云。它是第一个在电力基础设施领域准确共参考的图像+LiDAR数据集。数据集由36个地理区域组成,每个区域包含对齐的多模态数据(图像、分割掩码、LiDAR点云和相机参数)。数据集的类别分为12个语义组。数据集分为训练集和测试集,以保证公平评估。
GridNet-HD is a dataset designed for 3D semantic segmentation tasks in power infrastructure, encompassing both images and 3D point clouds. It is the first accurately co-referenced image+LiDAR dataset in the power infrastructure field. The dataset consists of 36 geographic regions, each containing aligned multimodal data including images, segmentation masks, LiDAR point clouds and camera parameters. The dataset's categories are divided into 12 semantic groups, and is split into training and test sets to ensure fair evaluation.
创建时间:
2025-04-30
原始信息汇总
GridNet-HD 数据集概述
1. 数据集简介
- 用途:用于电力基础设施领域的3D语义分割任务,结合图像和3D点云数据。
- 特点:
- 首个在电力基础设施领域精确共参考的Image+LiDAR数据集。
- 包含公开排行榜:leaderboard。
- 相关论文:
- 标题:GridNet-HD: A High-Resolution Multi-Modal Dataset for LiDAR-Image Fusion on Power Line Infrastructure
- 会议:Submitted to NeurIPS 2025
2. 数据集结构
-
地理区域:36个地理区域,每个区域以区域代码命名(如t1z4, t1z5a等)。
-
数据内容:
- 对齐的多模态数据(图像、分割掩码、LiDAR点云和相机参数)。
- 支持高精度图像到3D投影的多模态融合3D语义分割任务。
-
文件夹布局:
dataset-root/ ├── t1z5b/ │ ├── images/ # RGB图像(.JPG格式) │ ├── masks/ # 语义分割掩码(.png格式,单通道标签) │ ├── lidar/ # LiDAR点云(.las格式,含ground_truth字段) │ └── pose/ # 相机位姿和内部参数(文本文件) ├── t1z6a/ │ ├── ... ├── ... ├── split.json # 定义训练/测试分区的JSON文件 └── README.md
3. 类别分组
- 12个语义组:
组ID 原始类别 描述 0 0,1,2,3,4 铁塔 1 5 导线电缆 2 6,7 结构电缆 3 8,9,10,11 绝缘子 4 14 高植被 5 15 低植被 6 16 草本植被 7 17,18 岩石、砾石、土壤 8 19 不透水土壤(道路) 9 20 水 10 21 建筑 255 12,13,255 未分配-未标注
4. 数据集划分
- 训练集:约70%的LiDAR点。
- 测试集:约30%的LiDAR点。
- 划分特点:
- 覆盖所有语义组(除忽略组外)。
- 训练和测试之间无项目重叠。
- 类别分布平衡。
5. 数据集统计
- 类别分布:
组ID 训练点数量 测试点数量 总点数 测试占比(%) 0 11,490,104 3,859,573 15,349,677 25.1 1 7,273,270 3,223,720 10,496,990 30.7 2 1,811,422 903,089 2,714,511 33.3 3 821,712 230,219 1,051,931 21.9 4 278,527,781 135,808,699 414,336,480 32.8 5 78,101,152 37,886,731 115,987,883 32.7 6 1,155,217,319 461,212,378 1,616,429,697 28.5 7 135,026,058 99,817,139 234,843,197 42.5 8 13,205,411 12,945,414 26,150,825 49.5 9 1,807,216 1,227,892 3,035,108 40.5 10 6,259,260 2,107,391 8,366,651 25.2 总计 1,689,540,705 759,222,245 2,448,762,950 31.0
6. 使用说明
- 下载:
- 数据集大小约170 GB。
- 需安装git-lfs。
- 下载命令: bash git clone https://huggingface.co/datasets/heig-vd-geo/GridNet-HD
7. 许可证与引用
-
许可证:CC-BY-4.0。
-
引用:
GridNet-HD: A High-Resolution Multi-Modal Dataset for LiDAR-Image Fusion on Power Line Infrastructure Masked Authors Submitted to NeurIPS 2025.
搜集汇总
数据集介绍

构建方式
GridNet-HD数据集作为电力基础设施领域首个高分辨率多模态数据集,其构建过程体现了严谨的工程方法论。研究团队通过无人机采集系统获取36个地理区域的同步数据,每个区域包含RGB图像、语义分割掩码、LiDAR点云及相机参数等多模态数据。数据采集采用专业级设备,确保图像与点云数据达到亚厘米级空间配准精度。为保障数据质量,团队设计了分层抽样策略,覆盖12类电力设施相关语义目标,并通过人工标注与自动化校验相结合的方式完成标注。数据集按7:3比例划分为训练集和测试集,分区时严格避免项目重叠,确保评估的公正性。
特点
该数据集最显著的特点是实现了电力设施场景中图像与LiDAR数据的高精度空间配准,点云密度达到行业领先水平。数据涵盖输电塔、导线、绝缘子等12类电力设施关键要素,其中植被类别占比最高,反映了真实场景的复杂性。数据集规模庞大,包含超过24亿个标注点云数据点,170GB的原始数据量。特别值得注意的是,测试集采用盲评机制,通过在线排行榜系统进行客观评估,有效避免了模型过拟合问题。多模态数据的严格时空对齐特性,使其特别适合开展跨模态融合算法的研究。
使用方法
使用该数据集时需通过Hugging Face Hub的snapshot_download方法下载,由于数据体量庞大,建议确保存储空间和网络稳定性。数据处理需注意原始21类标签到12个语义分组的映射转换,测试集评估需通过官方排行榜提交预测结果。数据集采用LAS格式存储点云数据,JPG格式存储图像,配套提供相机位姿参数文件。研究人员可基于该数据集开展多模态3D语义分割任务,特别推荐用于电力设施巡检算法的开发。官方提供了基准模型代码库,建议新研究以此为起点,确保结果可比性。所有使用需遵循CC-BY-4.0许可协议并引用相关论文。
背景与挑战
背景概述
GridNet-HD数据集作为电力基础设施领域首个高分辨率多模态数据集,由HEIG-VD等机构于2025年提出,旨在解决LiDAR与图像融合的3D语义分割难题。该数据集创新性地实现了无人机采集的RGB图像与高密度激光雷达点云的精准空间配准,覆盖12类电力设施语义标签,填补了电力巡检领域缺乏高质量标注数据的空白。其独特的跨模态对齐特性为智能电网巡检算法开发提供了重要基准,推动了计算机视觉与遥感技术在关键基础设施维护中的应用。
当前挑战
数据集构建面临多模态数据精确配准的技术壁垒,需解决无人机航拍图像与LiDAR点云在毫米级精度下的时空同步问题。语义标注过程涉及复杂场景下的细粒度分类,特别是绝缘子、导线等电力设备的精确区分。评估环节采用隐藏测试集的公平性机制,要求算法具备处理大规模点云(超24亿数据点)的鲁棒性,同时克服植被遮挡等现实场景干扰,这对三维深度学习模型的泛化能力提出严峻考验。
常用场景
经典使用场景
在电力基础设施的智能巡检领域,GridNet-HD数据集通过融合LiDAR点云与高分辨率图像数据,为三维语义分割任务提供了精准的多模态基准。其核心价值体现在对输电塔、绝缘子、导线等电力设备的精细化分类,研究者可利用对齐的影像与点云数据开发跨模态特征提取算法,在复杂自然环境背景下实现电力元件的高精度识别与空间定位。
实际应用
在实际电力运维中,该数据集支撑的算法可应用于无人机自主巡检系统,实现对输电线路缺陷的自动检测。例如通过绝缘子破损识别、导线覆冰监测等具体任务,显著提升巡检效率并降低人工攀爬风险。其高密度点云特性特别适合构建电力走廊数字孪生模型,为电网资产管理提供三维可视化基础。
衍生相关工作
基于该数据集衍生的经典工作包括多模态Transformer架构在电力场景的适配研究、小样本学习在稀缺电力设备分类中的应用等。相关成果已推动PointNet++、KPConv等点云网络在垂直领域的优化,并催生出针对电力设备几何特性的新型注意力机制与损失函数设计。
以上内容由遇见数据集搜集并总结生成



