five

IGNF/FRACTAL

收藏
Hugging Face2025-04-05 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/IGNF/FRACTAL
下载链接
链接失效反馈
官方服务:
资源简介:
FRACTAL是一个用于3D点云语义分割的基准数据集,包含100,000个点云,覆盖了5个法国地区的250平方公里区域。数据集来源于Lidar HD项目,通过高效的采样策略平衡了稀有类别,并集中了具有挑战性的景观和场景。每个点云大小为50 x 50米,点密度高,平均每平方米有37个点。数据集包含7个语义类别,并使用高分辨率航空图像进行着色。数据集分为训练集、验证集和测试集,分别包含80,000、10,000和10,000个点云。数据集的获取年份作为元数据提供,且数据集的分布和分割情况也有详细说明。

FRACTAL is a benchmark dataset for 3D point cloud semantic segmentation, consisting of 100,000 point clouds covering a total area of 250 square kilometers across 5 regions in France. The dataset is sourced from the Lidar HD project, where an efficient sampling strategy is employed to balance rare categories and aggregate challenging landscapes and scenes. Each point cloud corresponds to a 50 × 50 meter area, with a high point density averaging 37 points per square meter. It encompasses 7 semantic categories, with points colored using high-resolution aerial imagery. The dataset is split into training, validation, and test sets, which contain 80,000, 10,000, and 10,000 point clouds respectively. The acquisition year of the dataset is provided as metadata, and detailed descriptions of its distribution and data splits are also available.
提供机构:
IGNF
原始信息汇总

FRACTAL 数据集概述

数据集基本信息

  • 名称: FRACTAL
  • 类型: 3D点云语义分割基准数据集
  • 大小: 100,000 点云
  • 覆盖面积: 250 km²
  • 来源: Lidar HD 计划 (2020-2025)
  • 点密度: 10 脉冲/m²,平均 37 pts/m²,总计 9261M
  • 语义类别: 7 类(其他 | 地面 | 植被 | 建筑 | 水 | 桥梁 | 永久结构)
  • 颜色化: 使用 ORTHO HR® 的高分辨率航空图像

数据集内容

  • 数据集组成:
    • 训练集: 80,000 点云
    • 验证集: 10,000 点云
    • 测试集: 10,000 点云
  • 点云密度: 10 脉冲/m²,约 40 pts/m²
  • 颜色化: 使用 0.2 m 空间分辨率的近红外、红、绿和蓝通道的航空图像
  • 采集时间: 数据采集跨越多年,最多可能相隔 3 年

类别分布

类别 训练集 (%) 验证集 (%) 测试集 (%)
其他 0.6 0.5 0.7
地面 39.0 39.1 40.5
植被 57.0 56.9 54.1
建筑 2.8 2.8 3.3
0.5 0.5 1.2
桥梁 0.1 0.1 0.2
永久结构 0.04 0.04 0.04

数据集范围和训练/验证/测试分割

  • 采样区域: 5 个法国南部空间域,总面积 17,280 km²
  • 分割: 80% 训练集,10% 验证集,10% 测试集
  • 测试区域: 25 km²,从每个空间域的连续测试区域采样,总计 1049 km²
  • 训练和验证区域: 200 km² + 25 km²,剩余区域采用空间分层采样

航空图像

引用

@misc{gaydon2024fractal, title={FRACTAL: An Ultra-Large-Scale Aerial Lidar Dataset for 3D Semantic Segmentation of Diverse Landscapes}, author={Charles Gaydon and Michel Daab and Floryne Roche}, year={2024}, eprint={TBD}, archivePrefix={arXiv}, url={https://arxiv.org/abs/TBD} primaryClass={cs.CV} }

数据集许可证

  • 许可证: "OPEN LICENCE 2.0/LICENCE OUVERTE",由法国政府创建,用于促进公共管理部门的开放数据传播。
  • 兼容性: 与英国的“Open Government Licence” (OGL)、Creative Commons的“Creative Commons Attribution” (CC-BY) 和 Open Knowledge Foundation的“Open Data Commons Attribution” (ODC-BY) 兼容。
搜集汇总
数据集介绍
main_image_url
构建方式
FRACTAL数据集的构建,是基于法国境内17,280平方公里区域的Lidar HD计划数据,采用高效且简单的抽样方案。此方案不仅平衡了罕见类别,还集中了具有挑战性的景观和场景,从而形成了包含100,000个点云的庞大集合,旨在为3D点云语义分割提供基准。
特点
该数据集具有开放性、多样性和大规模的特点。其涵盖了来自五个不同空间域的100,000个点云,总面积达250平方公里。每个点云都采用高分辨率航空影像进行垂直着色,并附有详细的元数据,包括类别直方图、高程及高程增益等信息。此外,数据集针对七个语义类别进行了分类。
使用方法
用户可以通过HuggingFace的数据集库来加载和使用FRACTAL数据集。该数据集被分为训练集、验证集和测试集,分别占总数据量的80%、10%和10%。每个数据补丁包含高密度航空Lidar点云,并提供了相应的航空影像数据。用户需遵守开放许可2.0/LICENCE OUVERTE,确保在使用数据时正确引用和归属。
背景与挑战
背景概述
FRACTAL数据集,全称为FRench ALS Clouds from TArgeted Landscapes,是一个针对3D点云语义分割的基准数据集,具有大规模、开放性和多样性特点。该数据集由法国IGN机构于2020年至2025年间的Lidar HD项目中采集,旨在通过高效的采样方案,平衡稀有类别并聚焦于具有挑战性的景观和场景。FRACTAL包含了10万份空中激光扫描(ALS)点云数据,覆盖了250平方公里的总面积,数据点密度高,平均每平方米有37个点。数据集被分为7个语义类别,并采用高分辨率航空影像进行颜色标注。该数据集的研究背景主要涉及地球观测和环境领域,为相关研究提供了宝贵的资源。
当前挑战
FRACTAL数据集在研究领域中面临的挑战主要包括:1) 如何在多样化的景观中进行有效的3D点云语义分割,尤其是在处理稀有类别和具有挑战性的场景时;2) 数据集构建过程中,如何处理不同年份采集的Lidar和影像数据之间的时间差异,以及如何确保数据的质量和一致性。此外,数据集的广泛应用也带来了在数据隐私保护、版权归属等方面的挑战。
常用场景
经典使用场景
在三维点云语义分割领域,FRACTAL数据集以其大规模、开放性与多样性成为一项重要的基准。该数据集由来自法国五个地区的10万点云组成,覆盖总面积达250平方公里,为研究者提供了一个丰富的资源库,用以训练和评估算法在真实世界场景中的表现。
解决学术问题
FRACTAL数据集解决了传统点云数据集规模有限、地理分布单一的问题,其高密度的点云和丰富的语义类别为三维场景理解、地物分类等学术研究提供了强有力的支持,从而推动了相关领域的技术进步和理论发展。
衍生相关工作
基于FRACTAL数据集,学术界已经衍生出了一系列相关工作,包括但不限于点云处理算法的改进、三维场景理解模型的构建以及多源数据融合技术的探索,这些研究进一步拓展了数据集的应用范围,推动了相关领域的创新发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作