CMEdataset
收藏arXiv2025-04-10 更新2025-04-15 收录
下载链接:
https://drive.google.com/file/d/185iK7cG4J1Dws1wX1sUqVOt57CWwXnEG/view
下载链接
链接失效反馈官方服务:
资源简介:
CMEdataset是由山东计算机科学与技术中心创建的地图数据集,包含1,455张中国地图的数字图像,涵盖了包括政治地图、地形地图等在内的多种类型地图。该数据集旨在为问题地图检测提供多样化的样本,支持研究和发展问题地图检测技术,应用场景包括地图合规性检测与规范、地图更新与维护、国家安全与敏感地图监测等。数据集的图像来源于国家地理信息公共服务平台及多个公开地图平台,经过统一格式转换和预处理,并采用专业的标注团队进行多轮验证和审核,确保了数据集的质量和标注的准确性。
The CMEdataset is a map dataset developed by the Shandong Computer Science and Technology Center. It contains 1,455 digital images of Chinese maps, covering a diverse range of types including political maps, topographic maps and more. This dataset aims to provide diversified samples for problematic map detection, and supports research and technological advancement in the field of problematic map detection. Its applicable scenarios include map compliance inspection and standardization, map update and maintenance, national security and sensitive map monitoring, etc. The images of the dataset are collected from the National Geospatial Information Public Service Platform and multiple public map platforms. All images have undergone unified format conversion and preprocessing, and have been subject to multi-round verification and review by professional annotation teams, thus ensuring the dataset's quality and the accuracy of the annotations.
提供机构:
山东计算机科学与技术中心(国家超级计算济南中心)
创建时间:
2025-04-10
搜集汇总
数据集介绍

构建方式
在构建CMEdataset数据集时,研究团队采用了多源数据采集策略,主要从国家地理信息公共服务平台及多个公开在线地图平台获取中国地图数字图像。数据预处理阶段通过去噪、裁剪和尺寸标准化等技术手段提升图像质量,并采用旋转、平移等数据增强方法增加样本多样性。标注工作由专业团队完成,采用YOLO和COCO两种标准化格式进行双重标注,并通过交叉验证机制确保标注准确性。数据集最终包含1,455张涵盖政治地图、地形图等多种类型的高清地图图像(分辨率≥300dpi),时间跨度为2015年至今。
特点
CMEdataset作为专注于中国地图问题检测的专业数据集,其核心特点体现在三个方面:内容上系统覆盖南海诸岛、钓鱼岛等五大类典型地图问题区域,包含3,020个精细标注样本;技术上首创双格式标注体系(YOLO+COCO),支持边界框与多边形分割的双重检测需求;数据质量上通过专家团队多轮校验,平均标注准确率达87.2%(mAP@0.5)。特别针对小目标检测难题,数据集包含472个南海岛礁样本和409个钓鱼岛相关样本,为复杂边界识别提供丰富训练素材。
使用方法
该数据集适用于地图合规性检测、国家安全监测等多元场景。使用时应首先按照分层目录结构加载图像及对应标注文件(JPEG+JSON/TXT)。针对不同任务需求:边界检测推荐采用YOLO格式的归一化坐标进行模型训练,复杂要素识别建议使用COCO格式的细分多边形标注。实验表明,基于该数据集训练的YOLOv9s模型在模糊边界检测任务中达到83.1%的mAP@0.5性能。研究者可通过公开的Google Drive链接获取数据集,注意需遵守附带的授权协议,学术使用时须规范引用原始论文。
背景与挑战
背景概述
CMEdataset是由齐鲁工业大学(山东省科学院)山东省计算中心(国家超级计算济南中心)的徐岩、张振强等研究人员于2025年提出的专业数据集,专注于中国地图检测与标准化领域。该数据集填补了当前公开数据在'问题地图'五大关键要素(国界错绘、要素缺失、边界模糊、错误标注和地图合规性)上的空白,其1455张数字地图图像涵盖2015年至今的中国全境地形图,来源包括国家地理信息公共服务平台及多个公开在线地图平台。作为首个系统标注问题地图特征的数据集,CMEdataset通过YOLO和COCO双标注体系,为维护国家主权完整、提升地图合规检测技术提供了重要基础资源,推动了图像处理与人工智能技术在地图检测领域的创新应用。
当前挑战
CMEdataset面临的核心挑战体现在两个维度:在领域问题层面,地图检测需解决小目标(如南海诸岛)识别、复杂边界模糊区域分割、多尺度地理要素同步检测等难题,现有算法对0.5%以下面积比的微型目标检测精度不足35%;在构建过程中,数据源存在不同版本地图的标注标准差异(如阿克赛钦地区边界标注误差达±3.2像素),需通过专业团队三轮交叉验证确保标注一致性。此外,地图图像的动态更新特性导致2015-2025年间行政区划变更数据的时序对齐困难,需结合GIS技术进行空间拓扑校验。数据集还需克服政治地图与地形图色彩模式差异(RGB与CMYK色域偏差达12.7%)带来的特征提取干扰。
常用场景
经典使用场景
在数字地图检测领域,CMEdataset为识别中国国界和省级边界提供了丰富的图像资源。这些高分辨率地图图像不仅涵盖了政治地图、地形图等多种类型,还特别标注了常见的边界错误和遗漏问题。数据集通过标准化的预处理流程和双格式标注(YOLO与COCO),成为训练边界识别算法的理想素材,尤其在检测南海诸岛、钓鱼岛等敏感区域的地理标注准确性方面具有不可替代的价值。
衍生相关工作
基于CMEdataset的经典衍生研究包括:SMCA-DETR团队开发的边界注意力机制模型(mAP@0.5达76.3%),YOLOv11s改进的小目标检测框架(参数量仅2.5M),以及Lite-DETR提出的轻量化地图异常检测方案。这些工作共同推动了《测绘学报》2025年提出的'智能审图'技术框架的形成,并促成ISO/TC211启动数字地图质量认证标准的修订。
数据集最近研究
最新研究方向
随着地理信息技术的迅猛发展,CMEdataset作为中国地图检测领域的专项数据集,正推动着地图合规性检测技术的革新。该数据集聚焦于具有边界错误、要素缺失等问题的地图样本,为深度学习模型在复杂地理场景下的性能优化提供了重要支撑。当前研究热点集中在小目标检测、模糊边界识别等关键技术突破上,通过引入多尺度特征融合和注意力机制,显著提升了模型对南海诸岛、钓鱼岛等敏感区域的检测精度。该数据集的发布不仅填补了问题地图检测领域的空白,更为国土安全监测、GIS数据自动化处理等国家战略需求提供了技术保障,具有重要的学术价值和社会意义。
相关研究论文
- 1CMEdataset Advancing China Map Detection and Standardization with Digital Image Resources山东计算机科学与技术中心(国家超级计算济南中心) · 2025年
以上内容由遇见数据集搜集并总结生成



