five

OAM-TCD|树冠分割数据集|生态监测数据集

收藏
arXiv2024-07-16 更新2024-08-01 收录
树冠分割
生态监测
下载链接:
https://huggingface.co/restor
下载链接
链接失效反馈
资源简介:
OAM-TCD数据集由苏黎世联邦理工学院等机构创建,是一个用于高分辨率航空影像中个体树冠划分的开源数据集。该数据集包含5072张2048x2048像素的图像,分辨率为10厘米/像素,涵盖超过28万个个体树和5.6万个树群的实例掩码。数据集通过全球采样,旨在捕捉不同生物群落和环境的树木多样性。创建过程中,数据集通过多次采样和简单过滤生成,确保了地理和生物群落的多样性。该数据集主要应用于生态监测、森林恢复评估等领域,旨在提高树冠覆盖度的量化准确性。
提供机构:
苏黎世联邦理工学院, Restor, WSL, 佛罗里达大学, Gainforest, 芝加哥大学
创建时间:
2024-07-16
AI搜集汇总
数据集介绍
main_image_url
构建方式
OAM-TCD数据集由OpenAerialMap(OAM)提供的全球高分辨率航空影像构建而成。数据集包含5072张2048x2048像素的图像,分辨率为10厘米/像素,并附带有人工标注的实例掩膜,覆盖超过28万个个体树和5.6万个树群。通过对全球范围内的影像进行采样,数据集更好地捕捉了不同陆地生物群落和城市及自然环境中树木的多样性和形态。为了确保训练数据的质量和多样性,数据集采用了分层抽样策略,将影像按照1度格网进行划分,并对每个格网内的影像进行随机采样。此外,数据集还包含了对影像的标签,包括语义掩膜和实例分割(多边形)格式,分别针对单个树木和树冠(树群)进行标注。
特点
OAM-TCD数据集具有以下特点:1)高分辨率:数据集包含高分辨率的航空影像,分辨率为10厘米/像素,能够清晰地识别单个树木和树冠结构;2)全球多样性:数据集包含了来自全球不同地区的影像,涵盖了多种陆地生物群落和城市及自然环境中树木的多样性和形态;3)实例分割:数据集提供了单个树木和树群的实例分割标注,方便进行树木个体识别和树冠覆盖度估计;4)开放许可:数据集以开放许可的方式发布,便于研究人员和开发者使用。
使用方法
使用OAM-TCD数据集的方法如下:1)下载数据集:可以从HuggingFace Hub或Zenodo平台下载OAM-TCD数据集;2)准备标注:数据集提供了语义掩膜和实例分割标注,可以用于训练和评估树木识别模型;3)模型训练:使用标注数据训练树木识别模型,可以使用开源的深度学习框架,如Detectron2或PyTorch;4)模型评估:使用数据集提供的测试集评估模型的性能,可以使用交叉验证或独立数据集进行评估;5)模型应用:使用训练好的模型进行树木识别和树冠覆盖度估计,可以应用于生态监测、城市规划等领域。
背景与挑战
背景概述
树木覆盖度是生态系统监测和评估恢复站点进展的重要指标。近年来,深度学习分割算法已被证明能够利用高分辨率航空和卫星图像,在国家甚至大陆尺度上准确地绘制树木。高分辨率(理想情况下为亚米级)的绘制对于识别单个树木至关重要,但很少有开放获取的数据集包含实例级别的注释,且现有的数据集规模较小或地理多样性不足。OAM-TCD数据集是一个新颖的开放获取数据集,用于从OpenAerialMap(OAM)中获取的高分辨率航空图像中进行单个树木冠层绘制(TCD)。我们的数据集OAM-TCD包含5072张2048x2048像素的图像,分辨率为10厘米/像素,以及与超过28万棵单个树木和5.6万组树木相关联的人工标记实例掩码。通过从世界各地采样图像,我们能够更好地捕捉不同陆地生物群落中树木的多样性和形态,以及在城市和自然环境中。使用我们的数据集,我们训练了参考实例和语义分割模型,这些模型与现有的最先进模型相比具有优势。我们通过k折交叉验证和与现有数据集的比较来评估性能;此外,我们在独立捕获的瑞士航空图像上展示了有说服力的结果,并与苏黎世市的市政树木清单和激光雷达衍生的冠层图进行了比较。我们的数据集、模型和训练/基准代码在宽松的开源许可下公开发布:创意共享(多数为CC BY 4.0),以及Apache 2.0。
当前挑战
OAM-TCD数据集面临的挑战包括:1)构建过程中所遇到的挑战,如地理多样性的采样和实例级别的注释;2)解决领域问题,如全球树木检测。全球树木检测的挑战在于树木形态的巨大多样性,以及在没有激光雷达等额外数据的情况下,如何准确地分割密集冠层中的单个树木。OAM-TCD数据集的构建旨在解决这些挑战,但它仍然面临一些局限性,如某些生物群落和地理区域的代表性不足,以及人工标记过程中的一致性。
常用场景
经典使用场景
OAM-TCD数据集是一个全球范围内的高分辨率树冠图数据集,主要应用于生态监测和恢复地点的评估。该数据集包含来自OpenAerialMap(OAM)的5072张2048x2048像素、10厘米/像素分辨率的图像,以及超过28万个单棵树和5.6万个树群的实例级标签。数据集的地理多样性使得研究人员能够更好地捕捉不同陆地生物群落中的树木多样性和形态,包括城市和自然环境中的树木。使用该数据集,研究人员可以训练参考实例和语义分割模型,并与现有的最先进模型进行比较。此外,研究人员还展示了在独立采集的瑞士上空航空图像上的显著结果,并与苏黎世市的市政树木清单和激光雷达衍生冠层图进行了比较。
衍生相关工作
OAM-TCD数据集的发布衍生了许多相关工作,包括基于该数据集训练的参考实例和语义分割模型,以及一个开源的训练、预测和报告流程。此外,研究人员还使用该数据集评估了不同模型的性能,并与现有的最先进模型进行了比较。这些相关工作有助于推动高分辨率树冠图绘制技术的发展,并为生态监测和恢复地点的评估提供了新的工具和方法。
数据集最近研究
最新研究方向
OAM-TCD数据集的发布标志着高分辨率树木覆盖图分割领域的重大进步。该数据集提供了来自全球各地的高分辨率航空图像,以及与之相关的超过28万个树木实例和5.6万个树群组的实例级标注。这一独特的资源为研究人员提供了探索树木形态多样性、生态系统监测和恢复项目评估的宝贵数据。OAM-TCD数据集的开放性使得全球范围内的树木覆盖监测成为可能,这对于气候变化的缓解和生物多样性的保护具有重要意义。此外,该数据集的发布还推动了基于深度学习的分割算法在树木覆盖图分割领域的应用,为生态监测和森林恢复提供了强有力的工具。
相关研究论文
  • 1
    OAM-TCD: A globally diverse dataset of high-resolution tree cover maps苏黎世联邦理工学院, Restor, WSL, 佛罗里达大学, Gainforest, 芝加哥大学 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Materials Project

材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)

OpenDataLab 收录

OMIM (Online Mendelian Inheritance in Man)

OMIM是一个包含人类基因和遗传疾病信息的在线数据库。它提供了详细的遗传疾病描述、基因定位、相关文献和临床信息。数据集内容包括疾病名称、基因名称、基因定位、遗传模式、临床特征、相关文献引用等。

www.omim.org 收录

IndustryCorpus_agriculture

该数据集是通过应用22个行业数据处理操作符,从超过100TB的开放源数据集中筛选出的3.4TB高质量多行业分类的中英文预训练数据集。筛选后的数据包括1TB的中文数据和2.4TB的英文数据,并进行了12种类型的标签标注。数据集涵盖18个行业类别,包括医疗、教育、文学、金融等,并提供了各行业类别的数据大小。

huggingface 收录

Nexdata/chinese_dialect

该数据集包含25,000小时的中文方言语音数据,收集自多个方言区域的本地方言使用者,涵盖闽南语、粤语、四川话、河南话、东北话、上海话、维吾尔语和藏语等。数据格式为16kHz、16bit、未压缩的wav文件,单声道。句子准确率超过95%。数据集支持的任务包括自动语音识别(ASR)和音频说话人识别。

hugging_face 收录

中国沙漠边界数据集(2000-2020年)

  本数据集基于Landsat遥感影像,通过辐射定标和大气校正等预处理算法得到沙漠区域影像,通过人工目视解译及波段指数的方法提提取沙漠边界区域。数据集涉及的沙漠主要包括中国八大沙漠。分别为腾格里沙漠,塔克拉马干沙漠,巴丹吉林沙漠,库布奇沙漠,乌兰布和沙漠,库木塔格沙漠,古尔班通古特沙漠,...

国家冰川冻土沙漠科学数据中心 收录