GEOBench-VLM|视觉-语言模型数据集|地理空间任务数据集
收藏GEOBench-VLM: Benchmarking Vision-Language Models for Geospatial Tasks
💡 概述
GEOBench-VLM 是一个专门用于评估视觉语言模型(VLM)在地理空间任务上的基准测试。该基准测试包含超过10,000个问题,涵盖了地球观测任务中的多种任务,如时间理解、指代分割、视觉定位、场景理解、计数、详细图像描述和关系推理。每个任务都旨在捕捉独特的领域特定挑战,涉及不同的视觉条件和对象尺度,适用于灾害评估、城市规划和环境监测等应用。
🏆 贡献
- GEOBench-VLM 基准测试:引入了一个专门用于评估 VLM 在地理空间任务上的基准测试套件,涵盖8个主要类别和31个子任务,包含超过10,000个手动验证的问题。
- VLM 评估:详细评估了十个最先进的 VLM,包括通用(开源和闭源)和任务特定的地理空间 VLM,突出了它们在处理地理空间任务方面的能力和局限性。
- 地理空间任务性能分析:分析了 VLM 在多种任务中的表现,包括场景分类、计数、变化检测、关系预测、视觉定位、图像描述、分割、灾害检测和时间分析,提供了改进 VLM 以用于地理空间应用的关键见解。
🗂️ 基准测试比较
提供了通用和地理空间特定数据集与基准测试的概述,详细说明了模态、数据源、答案类型和注释类型。
🔍 数据集注释流程
注释流程整合了多样化的数据集、自动化工具和手动注释。任务如场景理解、对象分类和非光学分析基于分类数据集,而 GPT-4o 生成独特的多选题,包含一个正确答案、一个语义上最接近的选项和三个合理的替代选项。空间关系任务依赖于手动注释的对象对关系,通过交叉验证确保一致性。
📊 结果
- 总体性能:GPT-4o 在相对简单的任务中表现较好,如飞机类型分类、灾害类型分类、场景分类和土地利用分类,但在多样化的地理空间任务中平均准确率仅为40%。
- 时间理解结果:GPT-4o 在分类和计数任务中总体表现最佳。
- 指代表达检测:报告了在0.5 IoU 和0.25 IoU 下的精度。
🤖 定性结果
展示了模型在地理空间场景理解、计数、对象分类、事件检测和空间关系任务中的表现,强调了上下文推理和处理重叠视觉线索的重要性。

China Family Panel Studies (CFPS)
Please visit CFPS official data platform to download the newest data, WeChat official account of CFPS: ISSS_CFPS. The CFPS 2010 baseline survey conducted face-to-face interviews with the sampled households’ family members who live in the sample communities. It also interviewed those family members who were elsewhere in the same county. For those who were not present at home at the time of interview, basic information was collected from their family members at presence. All family members who had blood/marital/adoptive ties with the household were identified as permanent respondents. Prospective family members including new-borns and adopted children.
DataCite Commons 收录
中国近海地形数据集(渤海,黄海,东海,南海)
本数据集包含历年来通过收集和实测方法取得的中国近海水深点数据、地形图数据(ArcGIS格式),以及黄河口、莱州湾东部、辽东湾、山东南部沿海、南海部分海域的单波束、多波束水深测量数据,包括大尺度的低密度水深数据与局部高密度水深数据。
地球大数据科学工程 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
PlantVillage
在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。
OpenDataLab 收录
全国兴趣点(POI)数据
POI(Point of Interest),即兴趣点,一个POI可以是餐厅、超市、景点、酒店、车站、停车场等。兴趣点通常包含四方面信息,分别为名称、类别、坐标、分类。其中,分类一般有一级分类和二级分类,每个分类都有相应的行业的代码和名称一一对应。 POI包含的信息及其衍生信息主要包含三个部分:
CnOpenData 收录
