five

Thailand Location 77 Database

收藏
github2025-04-23 更新2025-04-24 收录
下载链接:
https://github.com/JonusNattapong/ThailandLocation77DatabaseSQLServer
下载链接
链接失效反馈
官方服务:
资源简介:
泰国地理位置数据库,包含77个省份、998个地区、8,860个乡镇以及完整的邮政编码信息,适合用于后台系统、注册表单、GIS和应用程序开发。

The Thai geographical database encompasses 77 provinces, 998 districts, 8,860 townships, and comprehensive postal code information, suitable for use in background systems, registration forms, GIS, and application development.
创建时间:
2025-04-23
原始信息汇总

Thailand Location 77 Database [SQL Server] 数据集概述

📌 数据集内容

  • 地域覆盖:
    • 6个分区
    • 77个省份(包含完整的英文名称)
    • 998个区(729个区有英文名称)
    • 8,860个子区
    • 完整的邮政编码覆盖

⚙️ 安装方法 (SQL Server)

  1. 设置Collation: sql ALTER DATABASE YourDatabaseName COLLATE Thai_CI_AS;

    替换YourDatabaseName为您的数据库名称

  2. 使用sqlcmd导入数据: bash sqlcmd -S "YourServer" -d "YourDatabase" -U "sa" -P "YourPassword" -i "thailand_sqlserver.sql" -f 65001

    替换"YourServer", "YourDatabase", "YourPassword".sql文件路径

🙏 数据来源

  • 原始数据 (泰语): AT12 @ ThaiCreate
  • 英文翻译: kongvut/thai-province-data
搜集汇总
数据集介绍
main_image_url
构建方式
Thailand Location 77 Database 是基于泰国行政区划的权威数据源构建而成,涵盖了泰国6大区域、77个省份、998个区县以及8,860个乡镇的详细信息。数据来源于ThaiCreate社区成员AT12提供的原始泰语数据,并经由kongvut项目团队进行英语翻译和标准化处理。数据集采用SQL Server数据库格式存储,通过严格的校对流程确保地名拼写和邮政编码的准确性,特别针对泰国本土字符集优化了Thai_CI_AS排序规则。
特点
该数据集以其全面性和多语言支持著称,不仅完整收录泰国各级行政区划的官方泰语名称,更创新性地提供了77个省份的英文译名及729个区县的英文对照。数据层级结构清晰,包含大区-省份-区县-乡镇四级行政单位,并整合了精准的邮政编码系统。特别值得注意的是,数据集采用符合泰国语言环境的Thai_CI_AS校对规则,有效解决了泰文字符排序和检索的技术难题。
使用方法
使用该数据集需预先配置SQL Server数据库的Thai_CI_AS排序规则,通过标准sqlcmd工具执行提供的SQL脚本即可完成部署。典型应用场景包括后端行政管理系统开发、多语言注册表单设计、地理信息系统集成等场景。开发者需替换连接字符串中的服务器地址、数据库名称及认证信息,脚本支持UTF-8编码(代码页65001)以确保泰文字符的正确处理。数据集与主流GIS平台和Web框架具有良好的兼容性。
背景与挑战
背景概述
Thailand Location 77 Database是由泰国开发者社区构建的一个综合性地理信息数据库,专注于提供泰国行政区划的详细数据。该数据集由AT12 @ ThaiCreate和kongvut/thai-province-data等贡献者共同开发,涵盖了泰国6大区、77个省份、998个区县、8860个乡镇以及完整的邮政编码信息。作为泰国首个同时支持泰语和英语命名的开源地理数据库,其设计初衷是为后台管理系统、注册表单、GIS应用和移动开发提供标准化数据支持。该数据集的出现填补了泰国本土化地理信息资源的空白,显著提升了东南亚地区空间数据基础设施的完整性。
当前挑战
该数据集面临的核心挑战在于解决泰国复杂行政区划的标准化问题。泰国行政体系包含多级嵌套结构,且存在历史沿革造成的命名不一致现象,数据集需要精确处理省-县-乡三级关联关系。构建过程中,团队需克服泰英双语地名匹配的困难,特别是729个区县名称的翻译验证工作。技术实现上,数据库需要特殊处理泰文字符集(Thai_CI_AS排序规则),并确保SQL Server环境下65001代码页的兼容性,这对跨平台数据迁移提出了严格要求。
常用场景
经典使用场景
在泰国地理信息系统(GIS)开发中,Thailand Location 77 Database作为基础地理数据源被广泛采用。该数据集完整覆盖了泰国77个省份、998个区县和8860个乡镇的行政区划信息,并附有英文译名,为跨国企业开发本地化服务提供了标准化地理编码支持。其层级分明的数据结构特别适合用于构建地址自动补全系统,在电商平台的物流地址模块中表现尤为突出。
实际应用
实际应用中,该数据集支撑着泰国邮政服务的智能分拣系统,其邮政编码与三级行政区划的精确对应关系显著提升了物流效率。金融科技公司将其集成至KYC(了解你的客户)验证流程,通过地址标准化降低合规风险。地方政府则利用该数据集搭建灾害应急管理系统,实现救援资源的精准调度。
衍生相关工作
基于该数据集衍生的经典工作包括kongvut开发的多语言行政区划API,支持泰英双语查询服务。泰国交通部将其与OpenStreetMap数据融合,构建了国家级路网拓扑模型。在学术领域,朱拉隆功大学团队利用该数据集训练了泰语地址分词模型,成果发表于ACL会议,推动了东南亚自然语言处理研究的发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作