five

postal-code-id

收藏
github2026-01-13 更新2026-01-16 收录
下载链接:
https://github.com/lokabisa-oss/postal-code-id
下载链接
链接失效反馈
官方服务:
资源简介:
印度尼西亚邮政编码数据集,与印度尼西亚行政区划代码(region-id)相关联。该仓库提供了版本化、可审计的邮政编码数据集,映射到印度尼西亚的行政村庄。邮政编码覆盖范围以两种不同的发布类型发布,以保持数据来源和正确性。

Indonesia Postal Code Dataset, associated with Indonesia administrative division codes (region-id). This repository provides a versioned, auditable postal code dataset mapped to Indonesia's administrative villages. The postal code coverage is released in two distinct publication types to maintain data provenance and correctness.
创建时间:
2026-01-07
原始信息汇总

印度尼西亚邮政编码数据集概述

数据集基本信息

  • 数据集名称:postal-code-id
  • 描述:印度尼西亚邮政编码数据集,与印度尼西亚行政区划(region-id)关联。
  • 核心目标:提供版本化、可审计的邮政编码数据集,并映射到印度尼西亚的行政村庄。

发布类型

1. 官方基准发布

  • 数据来源:西爪哇开放数据(2023年)。
  • 覆盖范围
    • 覆盖100%的 region-id 村庄。
    • 约84%的村庄拥有官方邮政编码。
    • 其余村庄标记为 UNASSIGNED
  • 特点:保守、来源权威,适合作为基准参考。
  • 发布示例
    • 版本:v2025Q1
    • 资产文件:postal_codes.csvpostal_codes.json
  • 发布页面:https://github.com/lokabisa-oss/postal-code-id/releases/tag/v2026Q1

2. 衍生全覆盖发布

  • 目标:通过增强官方基准数据,提供100%的邮政编码覆盖率。
  • 增强来源:印度尼西亚邮政公共邮政编码查询。
  • 覆盖范围:100%的 region-id 村庄均拥有邮政编码。
  • 数据构成
    • 西爪哇开放数据(官方基准)。
    • 印度尼西亚邮政公共查询(衍生信号)。
  • 特点
    • 完全覆盖。
    • 明确标记为 AUGMENTED
    • 包含每条记录的置信度分数。
    • 可追溯和可审计。
  • 适用场景:数据工程、搜索、验证和丰富管道,以及需要全覆盖的实际应用。
  • 重要说明:此发布非权威性,不得视为官方邮政编码注册表。

数据预览

  • 电子表格预览:提供了一个公开的Google电子表格用于快速检查和人工浏览。
  • 预览地址:https://docs.google.com/spreadsheets/d/1WA137b3k7NmQngzcb0QL8WG-gvMUFT3K92KGipl3T7A
  • 注意事项
    • 此为只读预览。
    • 可能包含衍生或合并视图。
    • 权威工件始终是GitHub Releases中的文件。

数据模式

  • 模式文件schema/postal_code.schema.json
  • 通用性:该模式在两种发布类型中共享
  • 保证内容
    • 每条记录的数据来源归属。
    • 明确的状态(OFFICIALAUGMENTEDUNASSIGNED)。
    • 非官方映射的置信度评分。

数据来源

  1. 西爪哇开放数据 – 邮政编码数据集(2023年),存档于 lokabisa-oss/id-documents
  2. 印度尼西亚邮政公共邮政编码查询 – 仅用于数据增强,不重新分发。

关键说明

  • 村庄标识符、名称和类型与 region-id 保持一致。
  • 增强的记录被明确标记,且从不与官方数据混合。
  • 没有明确的来源信号,则不会推断任何邮政编码。

免责声明

  • 邮政编码是由印度尼西亚邮政管理的运营数据。
  • 本仓库提供的参考数据集仅用于工程和研究目的,不声称是官方邮政机构。

可重现性

  • 该数据集设计为完全可重现和可审计
  • 每个发布版本均:
    • 使用固定的、不可变的输入。
    • 记录其数据源构成。
    • 产生确定性的输出。
搜集汇总
数据集介绍
main_image_url
构建方式
在印度尼西亚邮政编码数据集的构建过程中,采用了严谨的双重发布策略以确保数据的权威性与完整性。官方基线版本源自Open Data Jawa Barat(2023年)的公开数据,覆盖了所有行政村庄,其中约84%的村庄拥有官方邮政编码,其余则标记为“未分配”。为了达到全面覆盖,衍生版本通过整合Pos Indonesia的公开查询系统,对基线数据进行增强,为每个村庄补充邮政编码,同时明确标注数据来源与置信度,确保每条记录的可追溯性。
使用方法
数据集适用于多种场景,包括数据工程、搜索验证及信息增强流程。用户可通过GitHub发布页获取CSV或JSON格式的数据文件,其中官方基线版本适合需要权威参考的应用,而衍生版本则能满足对全覆盖邮政编码的需求。数据集还提供公开的电子表格预览,便于快速浏览;但需注意,衍生版本非官方权威数据,仅用于工程与研究目的。使用时需遵循数据模式规范,确保正确解析来源与状态字段。
背景与挑战
背景概述
在数字地理信息系统与区域行政管理的交叉领域,精准且可追溯的邮政编码数据对于物流规划、地址验证及社会经济分析具有基础性意义。postal-code-id数据集由印度尼西亚的开源组织Lokabisa于2023年后创建,旨在构建一个与印度尼西亚行政区划(region-id)严格关联的邮政编码参考数据集。该数据集通过整合西爪哇省开放数据官方基线,并辅以印度尼西亚邮政公开查询的衍生信号,致力于解决行政村庄层级邮政编码覆盖不全的核心研究问题,为工程应用与研究提供了结构化、可审计的数据基础。
当前挑战
该数据集致力于解决印度尼西亚行政村庄层级邮政编码的完整映射与验证问题,其核心挑战在于官方数据存在覆盖缺口,约16%的村庄缺乏官方编码,需通过非权威来源进行衍生补全。在构建过程中,挑战主要体现在数据源的异构性与权威性平衡上:一方面需严格区分官方基线与非官方增强数据,确保数据溯源清晰;另一方面,在整合印度尼西亚邮政公开查询信号时,必须维护数据的可审计性与确定性,避免无来源推断,同时明确标注增强记录的状态与置信度,以保障工程应用的可靠性。
常用场景
经典使用场景
在空间信息科学和地理信息系统领域,邮政编码数据集是构建精准地理编码服务的基础资源。postal-code-id数据集通过整合印度尼西亚官方发布的邮政数据与行政区域信息,为研究人员和开发者提供了一个权威且可追溯的数据基准。该数据集最经典的使用场景在于支持地理空间分析中的地址标准化与区域匹配,例如在人口统计、物流路径规划或社会经济研究中,将非结构化的地址文本映射到具体的行政村庄单元,从而实现空间数据的精确聚合与可视化。
解决学术问题
该数据集有效解决了地理信息科学中常见的行政区域与邮政代码映射缺失或不一致的问题。传统上,印度尼西亚的邮政代码覆盖存在空白,导致许多村庄在数据集中无法被准确定位。postal-code-id通过区分官方基线数据与增强覆盖版本,既保留了数据的权威性,又通过补充来源实现了100%的村庄覆盖。这一方法为学术界提供了研究数据完整性、来源可信度评估以及混合数据治理模型的范例,推动了开放数据在发展中国家地理编码应用中的标准化进程。
实际应用
在实际应用层面,postal-code-id数据集为电子商务、物流配送和公共服务平台提供了核心的地址验证与增强功能。例如,印度尼西亚的在线零售平台可以利用该数据集自动填充用户地址中的邮政编码,减少配送错误;政府机构则能基于完整的村庄级邮政代码,优化社会福利发放或紧急服务响应的地理定位。数据集中明确的来源标记和置信度评分,使得工程团队能够根据应用场景的风险容忍度,灵活选择官方数据或增强版本,平衡数据的准确性与覆盖范围。
数据集最近研究
最新研究方向
在空间信息科学与地理信息系统领域,邮政编码数据集作为关键的地理空间参照数据,其精确性与完整性直接影响物流规划、区域经济分析及公共服务数字化进程。postal-code-id数据集通过整合印度尼西亚官方数据与增强信号,实现了行政村庄层级的全覆盖,为相关研究提供了高质量基准。当前前沿研究聚焦于利用此类结构化地址数据驱动智能物流优化、区域社会经济指标建模,以及结合机器学习技术进行地址标准化与地理编码的自动化处理。该数据集的版本化与可审计特性,进一步支持了开放数据治理、溯源分析等热点议题,对提升东南亚地区数字基础设施的互操作性与可靠性具有显著意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作