five

Tinto

收藏
github2024-05-06 更新2024-05-31 收录
下载链接:
https://github.com/hifexplo/tinto
下载链接
链接失效反馈
官方服务:
资源简介:
Tinto数据集旨在帮助解决自动化地质制图方法的验证问题,并促进地球科学领域深度学习技术的发展。该数据集包含两种表示形式(tinto2D和tinto3D),涵盖三个基准数据集:一个真实数据集和两个合成数据集(无噪声和退化的)。真实数据集(tinto.real)包括在西班牙里奥廷托使用地面和空中传感器收集的可见光、近红外、短波和长波红外高光谱数据,这些数据已经过大气和地形校正,并投影到摄影测量点云上以生成超云(tinto3D)和相应的2D视图(tinto2D)。合成数据集(tinto.synth和tinto.degr)通过前向建模生成,共享与真实数据集相同的标签,以及几个潜在变量和空间关系,但使用光谱混合模型和模拟的矿物丰度空间分布生成。此外,还提供了两种版本的地面实况标签:简化版(tinto.labels_basic)和完整版(tinto.labels_complete)。

The Tinto dataset is designed to address the validation challenges of automated geological mapping methods and to advance the development of deep learning technologies in the field of earth sciences. The dataset comprises two representations (tinto2D and tinto3D) and covers three benchmark datasets: one real dataset and two synthetic datasets (noise-free and degraded). The real dataset (tinto.real) includes hyperspectral data collected using ground and aerial sensors in Rio Tinto, Spain, covering visible, near-infrared, shortwave, and longwave infrared spectra. These data have been atmospherically and topographically corrected and projected onto photogrammetric point clouds to generate hyperclouds (tinto3D) and corresponding 2D views (tinto2D). The synthetic datasets (tinto.synth and tinto.degr) are generated through forward modeling, sharing the same labels as the real dataset, along with several latent variables and spatial relationships, but are produced using spectral mixture models and simulated mineral abundance spatial distributions. Additionally, two versions of ground truth labels are provided: a simplified version (tinto.labels_basic) and a complete version (tinto.labels_complete).
创建时间:
2023-03-27
原始信息汇总

Tinto 数据集概述

数据集目的

Tinto 数据集旨在解决地质科学中深度学习技术自动生成地质图的验证问题,促进深度学习技术在该领域的发展。

数据集组成

数据集包含两种表示形式:tinto2D 和 tinto3D,以及三个基准数据集:

  1. tinto.real:包含在西班牙Rio Tinto地区通过地面和空中传感器采集的可见光、近红外、短波和长波红外高光谱数据。这些数据已校正大气和地形效应,并投影到摄影测量点云上,形成 hyperclouds (tinto3D) 和对应的2D视图 (tinto2D)。
  2. tinto.synthtinto.degr:通过正向建模生成的全合成光谱数据集,用于解决真实数据集可能存在的偏差或不一致性。tinto.synth 包含无噪声光谱,主要用于测试;tinto.degr 则添加了传感器噪声、光照和地形效应,以更好地模拟真实数据。

数据集特点

  • 多传感器数据:数据集整合了多种传感器的高光谱数据。
  • 两种数据表示:提供2D和3D数据表示,适用于不同深学习方法的验证。
  • 合成数据集:包含与真实数据集相同标签的合成数据,用于比较学习方法。

标签信息

数据集提供了两种标签版本:

  • tinto.labels_basic:简化版,将地质相似的类别合并,用于测试无监督方法。
  • tinto.labels_complete:完整版,推荐使用。

引用信息

若使用此数据集,请引用:

Afifi, Ahmed J., et al. “Tinto: Multisensor Benchmark for 3D Hyperspectral Point Cloud Segmentation in the Geosciences.” IEEE Transactions on Geoscience and Remote Sensing (2023). 10.1109/TGRS.2023.3340293

搜集汇总
数据集介绍
main_image_url
构建方式
Tinto数据集的构建旨在解决地质学领域中自动化映射技术的验证难题。该数据集包括两种表示形式(tinto2D和tinto3D),分别对应于真实数据集和合成数据集。真实数据集(tinto.real)通过在西班牙Rio Tinto地区采集的可见光、近红外、短波和长波红外高光谱数据构建,经过大气和地形校正后,投影到摄影测量点云上,形成超云(hyperclouds)和相应的2D视图。合成数据集(tinto.synth和tinto.degr)通过前向建模生成,包含无噪声和添加了传感器噪声、光照及地形效应的谱数据,以模拟真实数据。所有数据集的地面真值标签通过实验室XRD分析、高光谱解释和数字露头映射相结合的方式获得,确保了数据的高精度与可靠性。
特点
Tinto数据集的显著特点在于其多传感器融合和多维数据表示。数据集不仅包括真实采集的高光谱数据,还通过合成数据集提供了无噪声和噪声模拟的谱数据,这为不同机器学习方法的验证提供了理想的实验平台。此外,数据集提供了两种版本的地面真值标签(tinto.labels_basic和tinto.labels_complete),以适应不同复杂度的分类任务。这种设计不仅支持深度学习技术在地质学中的应用,还特别适用于3D数字露头模型的处理,填补了现有方法在处理3D数据上的空白。
使用方法
Tinto数据集的使用方法灵活多样,适用于多种地质学和遥感领域的研究。用户可以选择使用tinto2D或tinto3D数据进行2D或3D的深度学习模型训练和验证。对于合成数据集,用户可以利用其无噪声和噪声模拟的特性,进行算法鲁棒性和性能的测试。地面真值标签的两种版本(tinto.labels_basic和tinto.labels_complete)为用户提供了不同复杂度的分类任务选择,既可以用于监督学习,也可以用于无监督学习方法的测试。此外,数据集的合成矿物丰度和纯端元谱数据为端元提取和混合方法的研究提供了丰富的资源。
背景与挑战
背景概述
Tinto数据集是一个针对高光谱地球科学领域的基准数据集,由Ahmed J. Afifi等人于2023年创建。该数据集旨在解决从数字露头模型中自动生成地质图的挑战,特别是在使用高光谱图像生成数据丰富的‘超云’类型数字露头模型时。Tinto数据集包含了两个主要表示形式(tinto2D和tinto3D),分别对应真实数据和合成数据,这些数据通过实验室XRD分析、高光谱解释和数字露头映射等方法生成。该数据集的推出不仅为地质学领域的自动化映射提供了宝贵的资源,还为深度学习技术在该领域的进一步发展奠定了基础。
当前挑战
Tinto数据集面临的挑战主要集中在地质映射的主观性和验证数据的难以收集上。由于地质映射的复杂性和主观性,准确验证自动化映射方法的有效性变得尤为困难。此外,许多先进的深度学习方法仅限于2D图像数据,如何将这些方法应用于3D数字露头模型(如超云)是一个亟待解决的问题。数据集在构建过程中还面临了真实数据与合成数据之间潜在偏差或不一致性的问题,这些问题通过生成完全合成的光谱数据集得到了部分解决。然而,如何在保证数据质量的同时,确保合成数据与真实数据之间的有效对比,仍然是该数据集面临的重要挑战。
常用场景
经典使用场景
在地质科学领域,Tinto数据集的经典使用场景主要体现在利用深度学习技术从数字露头模型中自动生成地质图。该数据集通过提供真实和合成的超光谱数据,支持对地质特征的自动识别和分类,从而显著减少人工解释的时间并降低偏差。特别是,Tinto3D和Tinto2D的结合,使得研究人员能够在三维和二维空间中对地质特征进行全面分析,推动了超光谱图像在地质应用中的深度学习方法的发展。
衍生相关工作
Tinto数据集的发布催生了一系列相关的经典工作,特别是在超光谱图像处理和地质映射的深度学习应用方面。许多研究者利用该数据集进行算法优化和模型验证,推动了超光谱数据在三维数字露头模型中的应用研究。此外,Tinto数据集还激发了对合成数据生成和使用方法的深入探讨,为地质科学中的数据增强和算法测试提供了新的思路和工具,进一步促进了该领域的技术进步和创新。
数据集最近研究
最新研究方向
在地质科学领域,高光谱数据的应用正逐步推动自动化地质制图技术的发展。Tinto数据集作为高光谱地质科学的基准数据集,其最新研究方向聚焦于通过深度学习技术实现从数字露头模型中自动生成地质图,从而减少人为解释的时间和偏差。该数据集不仅包含了真实的高光谱数据,还提供了无噪声和降解的合成数据,以便于对不同机器学习方法进行精确验证。特别是,Tinto数据集的3D表示形式(tinto3D)为将深度学习方法应用于3D数字露头模型提供了新的可能性,解决了现有方法局限于2D图像数据的局限性。此外,合成数据的使用为测试和比较学习算法提供了理想的平台,尤其是在地面真实标签已知且无偏差的情况下。这些研究不仅推动了地质科学中自动化制图技术的前沿发展,还为高光谱数据在地质应用中的广泛使用奠定了基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作