CHOICE
收藏CHOICE 数据集概述
数据集基本信息
- 名称: CHOICE (Benchmarking the Remote Sensing Capabilities of Large Vision-Language Models)
- 存储平台:
- 大小: 6.07 GB (完整版)
- 子集大小: 460个样本 (GitHub上提供的CHOICE_subset)
数据集目的
- 系统性评估大型视觉语言模型(VLMs)在遥感领域的感知和推理能力。
关键特性
-
层次化能力分类:
- 2个主要能力维度: 感知和推理
- 6个二级维度
- 23个三级叶任务
-
数据特点:
- 10,507个问题
- 来自全球50个城市的数据
- 选择题形式,有明确答案
-
构建方法:
- 标签驱动构建
- 基础模型驱动构建
- 人-GPT4协作构建
- 人工质量控制
数据结构
bash perception ├── cross_instance_discerment │ ├── attribute_comparison │ │ ├── images │ │ └── attribute_comparison.json │ ├── change_detection │ │ ├── images │ │ └── change_detection.json │ ├── referring_expression_segmentation │ │ ├── images │ │ ├── masks │ │ └── referring_expression_segmentation.json │ └── spatial_relationship │ ├── images │ └── spatial_relationship.json ├── image_level_comprehension │ ├── image_caption │ │ ├── images │ │ └── image_caption.json │ ├── image_modality │ │ ├── images │ │ └── image_modality.json │ ├── image_quality │ │ ├── images │ │ └── image_quality.json │ ├── map_recognition │ │ ├── images │ │ └── map_recognition.json │ └── scene_classification │ ├── images │ └── scene_classification.json └── single_instance_identification ├── ......
reasoning ├── assessment_reasoning │ ├── environmental_assessment │ │ ├── images │ │ └── environmental_assessment.json │ └── resource_assessment │ ├── images │ └── resource_assessment.json ├── ......
主要发现
-
RSVLMs表现:
- 在专门训练的遥感任务中表现出色
- 相比通用领域VLMs没有明显优势
-
VLM挑战:
- 细粒度感知
- 复杂场景、社会属性和特定遥感特征的高级推理
-
开源VLM潜力:
- 可作为专有VLM的可行替代方案
- 某些任务中表现优于GPT-4o
局限性
- 现有数据集问题:
- 范围单一
- 评估维度分类粗糙
- 样本和任务数量有限
- 数据泄露导致非客观性
数据来源
- Google Earth
- Google Earth Engine (GEE)
- Sentinel卫星数据(ESA)
- Landsat卫星数据(USGS)
- OpenStreetMap (OSM)
使用限制
- 仅限学术用途
- 禁止商业使用




