Flatlandia
收藏Flatlandia 数据集
简介
Flatlandia 数据集是一个用于从对象检测和标注对象地图中进行视觉定位的新问题数据集。给定一张包含常见城市对象(如长椅、路灯、标志)的视觉图像和一个标注了类似城市对象位置的2D地图,目标是恢复视觉查询在地图上的位置(以纬度/经度表示)和角度(方向)。
该数据集基于Mapillary中的众包数据,涵盖五个欧洲城市。数据集的代码和详细信息在论文"You are here! Finding position and orientation on a 2D map from a single image: The Flatlandia localization problem and dataset."中介绍。
数据集内容
Flatlandia 数据集包含一系列从众包街景Mapillary图像中采样的视觉查询,每个查询都标注了对象检测(2D边界框和类别标签)。这些查询来自欧洲的20个区域,每个区域提供一个参考地图:一个2D地图,标注了场景中对象的位置(纬度和经度)和类别。
数据集存储在data/flatlandia.json中,可以使用torch dataloader轻松访问:
python from scripts.utils.dataloader import FlatlandiaLoader dataset = FlatlandiaLoader() for problem in dataset: ...
每个数据集条目是一个json文件,包含以下内容:
- reference_map: Flatlandia场景的ID(范围0-19)
- reference_xy: 参考地图中每个对象的纬度和经度
- reference_class: 每个对象的类别标签,编码为整数
- query_token: 与视觉查询关联的唯一Mapillary令牌
- query_xy: 相机在参考地图中的位置
- query_theta: 相机的方向
- query_matches: 检测到的对象在参考地图对象列表中的索引
- query_detections: 图像上检测到的对象位置,作为边界框的左上角和右下角
- intrinsics: 获取视觉查询的相机的内部参数
每个数据集条目可以使用scripts.utils.dataloader中定义的visualize_problem(x)函数进行可视化。
附加内容
除了Flatlandia数据集,还提供了:
- Flatlandia场景的SfM重建(
data/README.MD) - 数据集使用的示例代码(
scripts/README.MD)




