five

GlobalGeoTree

收藏
Hugging Face2025-05-16 更新2025-05-17 收录
下载链接:
https://huggingface.co/datasets/yann111/GlobalGeoTree
下载链接
链接失效反馈
官方服务:
资源简介:
GlobalGeoTree是一个全面的全球树种类分类数据集,包含630万棵树的地理定位信息,跨越275个科、2734个属和21001个种。每个样本都与哨兵-2图像时间序列和27个辅助环境变量配对。

GlobalGeoTree is a comprehensive global tree species classification dataset containing geospatial location information for 6.3 million trees, spanning 275 families, 2734 genera, and 21001 species. Each sample is paired with Sentinel-2 image time series and 27 auxiliary environmental variables.
创建时间:
2025-05-10
搜集汇总
数据集介绍
main_image_url
构建方式
在生物多样性研究领域,GlobalGeoTree数据集通过整合全球范围内的树木分布记录与多源遥感数据构建而成。该数据集汇集了630万条地理定位的树木样本,涵盖275个科、2734个属及21001个物种的完整分类层级。每个样本关联着Sentinel-2卫星生成的12个月度合成影像时间序列,并辅以27项关键环境变量,通过WebDataset格式实现高效存储与访问。
特点
该数据集最显著的特征在于其多层次 taxonomic 标签体系与多模态数据的深度融合。不仅提供物种、属、科三级分类信息,还特别设计了包含稀有、常见、高频物种的评估子集,支持从零样本到少样本的渐进式研究范式。时空维度上,月度遥感影像与地形气候等环境因子的耦合,为探索宏观生态规律提供了前所未有的数据支撑。
使用方法
研究人员可通过加载预训练的GeoTreeCLIP模型权重快速开展迁移学习,亦可直接调用WebDataset格式的训练集与评估集进行模型验证。数据集配套的CSV元数据文件详细记录了样本地理坐标、观测年份等背景信息,支持空间分析与溯源研究。建议结合官方GitHub仓库提供的训练脚本,充分发挥该数据集在跨区域树种识别任务中的潜力。
背景与挑战
背景概述
随着全球气候变化与生物多样性保护需求的日益凸显,精准监测植被分布成为生态遥感领域的关键课题。GlobalGeoTree数据集由慕尼黑工业大学等机构于2025年发布,聚焦于全球尺度树种分类研究,整合了630万条地理定位记录,覆盖275科2734属21001种树木,通过融合哨兵二号卫星时序影像与27种环境辅助变量,为多层次生物多样性分析提供了前所未有的数据支撑。该数据集通过构建跨大陆的树种光谱特征库,显著推动了遥感生态学在物种识别、分布预测等方向的方法创新。
当前挑战
在树种分类领域,模型需应对类间相似性高、类内变异大的本质难题,尤其面临稀有物种样本稀缺导致的分类偏差问题。数据集构建过程中,研究人员需克服多源异构数据融合的技术壁垒,包括卫星影像时空分辨率与物候周期对齐、全球采样点地理分布不均等挑战,同时需保证在跨洲际尺度下 taxonomy 标签体系的权威性与一致性。此外,如何处理哨兵二号影像中云层遮挡与大气噪声对时序数据质量的影响,亦是实现可靠分类的关键制约因素。
常用场景
经典使用场景
在生物多样性监测领域,GlobalGeoTree数据集为全球尺度树种识别提供了关键支持。通过整合275个科、2,734个属的21,001种树木的630万条地理定位记录,该数据集结合哨兵二号卫星时序影像与27种环境变量,成为零样本与少样本分类研究的基准平台。其层次化分类体系特别适用于跨区域物种分布模型的验证,为生态学家分析植被动态提供了多粒度视角。
解决学术问题
该数据集有效解决了遥感生态学中物种级分类精度不足的瓶颈问题。通过融合多模态数据,突破了传统方法在复杂地形与混交林区的识别局限,为宏观尺度生物多样性制图提供了新范式。其构建的层次化标签体系显著提升了跨物种迁移学习效果,对全球变化背景下物种分布范围推移研究具有重要理论价值。
衍生相关工作
基于该数据集衍生的GeoTreeCLIP预训练模型,开创了视觉-语言联合建模在生态遥感领域的新方向。多项研究在此基础上发展了跨模态注意力机制,推动了多时相遥感影像的语义理解。相关成果已延伸至入侵物种监测、碳储量估算等方向,形成了以地理空间智能为核心的系列创新工作。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作