LITHOS
收藏github2025-05-16 更新2025-05-17 收录
下载链接:
https://github.com/BCV-Uniandes/LITHOS
下载链接
链接失效反馈资源简介:
LITHOS是最大的公开可用数据集和基准,用于自动化岩石学分析,包含超过211,000个高分辨率偏光图像块和105,000个专家标注的矿物颗粒,涵盖25个类别。该数据集旨在加速从薄片图像进行自动化矿物学分析的研究和可重复性。
LITHOS is the largest publicly available dataset and benchmark for automated petrological analysis. It contains over 211,000 high-resolution polarized light image patches and 105,000 expert-annotated mineral grains spanning 25 categories. This dataset aims to accelerate research and reproducibility of automated mineralogical analysis from thin-section images.
创建时间:
2025-05-14
原始信息汇总
LITHOS 数据集概述
数据集简介
- 名称: LITHOS (Large-scale Imaging and Thin Section Optical-polarization Set for Automated Petrography)
- 用途: 自动化岩石学分析
- 特点:
- 目前最大的公开数据集和基准测试集
- 包含超过211,000个高分辨率偏振光图像块
- 包含105,000个专家标注的矿物颗粒
- 涵盖25个类别
数据集内容
- 图像数据: 高分辨率偏振光图像
- 标注数据: 矿物颗粒标注
- 模型与代码: 提供预训练模型和代码
下载与安装
- 下载方式: 通过Kaggle平台下载(当前为私有链接)
- 需要注册Kaggle账户
- 使用curl进行高效下载
- 安装:
- 使用conda环境
- 命令: bash conda env create -f environment.yaml conda activate LITHOS
预训练模型
- 下载链接: Google Drive
代码运行
- 主程序: main.py
- 参数选项:
- 学习率、批次大小、训练轮数等基础参数
- 模型类型(默认: PolarViT)
- 数据集路径(默认: LITHOS_DATASET_P/LITHOS_DATASET)
- 优化器选择(Adam或SGD)
- 学习率调度器选择(StepLR、CosineAnnealingLR或无)
- 数据平衡选项
- 多模态数据使用选项(如XPL数据)
目标
- 加速自动化矿物学分析的研究和可重复性
AI搜集汇总
数据集介绍

构建方式
LITHOS数据集作为自动化岩石学领域的重要资源,其构建过程体现了严谨的科学方法论。研究团队通过高分辨率偏光显微镜系统采集了超过21.1万张岩石薄片图像,覆盖25种典型矿物类别。每张图像均经过专业地质学家的精细标注,共计标注了10.5万个矿物颗粒边界。数据集采用多模态偏振光成像技术,包含交叉偏振光(XPL)和平行偏振光(PPL)两种成像模式,为矿物识别提供了丰富的光学特征信息。数据采集过程严格遵循地质学标准,确保样本具有代表性和多样性。
特点
LITHOS数据集以其规模和质量在自动化岩石学领域树立了新标准。该数据集最显著的特点是包含大规模的多模态偏振光图像数据,这种独特的数据结构为开发先进的矿物识别算法提供了理想条件。数据覆盖了从常见到稀有的25种矿物类别,每种类别都包含数千个标注样本,确保了数据的平衡性和代表性。图像分辨率达到专业岩石学研究要求,能够清晰呈现矿物的光学特性和结构特征。此外,数据集还提供了经过优化的基准模型和评估指标,为研究者提供了可靠的性能对比基准。
使用方法
使用LITHOS数据集需要先通过Kaggle平台完成注册和下载流程。数据集采用标准化的目录结构存储,便于直接加载到深度学习框架中。配套提供的Python环境配置文件可快速搭建所需的软件环境。研究人员可以使用提供的基准模型代码进行实验,该代码支持多种训练配置选项,包括学习率调整、批次大小设置和数据平衡策略等。数据集特别适合用于开发多模态融合算法,通过命令行参数可灵活控制是否使用交叉偏振光数据。评估阶段可直接加载预训练权重进行性能测试,大大降低了研究门槛。
背景与挑战
背景概述
LITHOS数据集作为自动化岩石学领域规模最大的公开基准数据集,由专业研究团队于近年构建完成,旨在推动薄片图像矿物分析的算法研究。该数据集收录了超过21万张高分辨率偏光图像样本和10.5万个人工标注的矿物颗粒,涵盖25个矿物类别,其规模与质量显著提升了该领域的研究基准。通过提供多模态偏振图像数据与双编码器Transformer基线模型,LITHOS为矿物自动分类建立了新的技术标准,对地质勘探、行星科学等领域的智能化分析具有重要促进意义。
当前挑战
在解决薄片图像矿物自动分类这一核心问题时,LITHOS需应对矿物光学特性复杂多变、多偏振模态数据融合等固有难题。数据构建过程中,研究团队面临大规模样本采集的硬件限制、跨实验室数据标准化处理,以及矿物专家标注成本高昂等实际挑战。如何准确建模矿物在正交偏光与锥光等不同成像条件下的非线性特征,成为算法开发的关键技术瓶颈。
常用场景
经典使用场景
在地质学和矿物学研究中,LITHOS数据集为自动化岩石学分析提供了重要支持。其大规模的高分辨率偏振光图像和专家标注的矿物颗粒数据,使得研究人员能够训练和验证深度学习模型,用于矿物分类和岩石薄片分析。该数据集特别适用于多模态图像分析,通过结合不同偏振状态下的图像信息,提升了矿物识别的准确性和可靠性。
实际应用
LITHOS数据集的实际应用场景广泛,涵盖了地质勘探、矿产资源评估和行星科学研究等领域。在地质勘探中,自动化矿物分析可以显著提高工作效率,减少人工鉴定的时间和成本。在行星科学研究中,该数据集可用于分析外星岩石样本,为行星地质学研究提供技术支持。
衍生相关工作
LITHOS数据集已衍生出多项经典研究工作,特别是在多模态图像融合和矿物分类算法方面。例如,基于该数据集开发的PolarViT模型,通过双编码器Transformer架构,显著提升了矿物分类的准确率。此外,许多研究利用LITHOS数据探索了深度学习在岩石学中的应用潜力,推动了自动化矿物分析技术的发展。
以上内容由AI搜集并总结生成



