five

India Geodata

收藏
github2026-03-18 更新2026-03-19 收录
下载链接:
https://github.com/yashveeeeeeer/india-geodata
下载链接
链接失效反馈
官方服务:
资源简介:
一个统一的、结构化的印度开放许可地理空间数据集合,包括行政边界、选举地图、人口普查几何、环境区域、水资源、基础设施网络、医疗保健、教育、城市市政数据等。

A unified, structured collection of openly licensed geospatial datasets for India, including administrative boundaries, electoral maps, census geometries, environmental zones, water resources, infrastructure networks, healthcare resources, educational data, urban municipal data, and more.
创建时间:
2026-03-08
原始信息汇总

India Geodata 数据集概述

数据集基本信息

  • 数据集名称: India Geodata
  • 访问地址: https://github.com/yashveeeeeeer/india-geodata
  • 浏览与下载地址: https://yashveeeeeeer.github.io/india-geodata
  • 许可证: 本仓库采用 CC BY 4.0 许可证,各数据集有其单独的许可证,记录在各自的 metadata.json 文件中。
  • 引用格式: bibtex @misc{india_geodata, title = {India Geodata: Unified Geospatial Data Repository}, year = {2026}, publisher = {GitHub}, url = {https://github.com/yashveeeeeeer/india-geodata} }

数据集内容与规模

这是一个统一的、结构化的印度开放许可地理空间数据集合,涵盖行政边界、选举地图、人口普查几何、环境区域、水资源、基础设施网络、医疗保健、教育、城市市政数据等。

总体规模: 包含超过 1800 个文件,分布在 14 个聚合的源集合和精选的外部链接中。

数据类别详情

类别 覆盖范围 格式 大小
行政边界 国家、邦、县、分区、街区、村务委员会、村庄、聚居地 Parquet, PMTiles, GeoJSONL, Shapefile ~27 GB
选举边界 议会选区、国会选区 Shapefile, GeoJSON, Parquet, PMTiles ~300 MB
人口普查 2011年行政单位、历史县区(1941–2024) Parquet, PMTiles, CSV ~1.1 GB
环境 森林、海岸带、土地利用、土壤分类、洪水清单、洪水图集 Parquet, PMTiles, GeoJSON, JSON ~8 GB
水资源与水文 河流、溪流、湖泊、水库、水塘、流域、灌溉、湿地、水体普查、城市水、自然特征 Parquet, PMTiles, GeoJSONL ~18.5 GB
基础设施 农村道路(PMGSY)、国家高速公路、SOI道路、NIC道路、ML道路、城市道路、铁路、内河航道、机场 Parquet, PMTiles, GeoJSONL, Shapefile, GeoJSON ~20 GB
建筑物 城市建筑足迹(AMRUT/Bhuvan, GSDL, VEDAS) Parquet, PMTiles, GeoJSONL.7z ~9 GB
能源 发电厂(煤炭、柴油、水力) GeoJSON ~128 KB
医疗保健 公共医疗设施(初级卫生中心、社区卫生中心、医院) GeoJSON ~47 MB
教育 学校、学院、大学、幼儿园 GeoJSON ~49 MB
城市 市政区(28个城市)、贫民窟、城市地方机构边界 GeoJSON, KML, Parquet, PMTiles ~430 MB
邮政 邮政编码边界 Shapefile, Parquet, PMTiles ~700 MB
警察 警察局管辖范围(部分邦)、警察局位置 Parquet, PMTiles, GeoJSON ~101 MB
印度测绘局 索引图、轮廓图、参考边界 Shapefile, PDF ~119 MB
遥感 VIIRS夜间灯光(2012–2024)、人口密度(WorldPop 2020) CSV, GeoJSON, GeoTIFF ~370 MB
外部数据集 SHRUG:50万+村庄的社会经济数据 CSV, Stata, Shapefile 链接至 DDL 门户

数据来源

该仓库整合了来自以下开放数据项目和政府门户的数据:

  • indian_admin_boundaries (ramSeraph)
  • datameet/maps (DataMeet)
  • datameet/pmgsy-geosadak (DataMeet)
  • datameet/landuse_maps (DataMeet)
  • datameet/INDIA_PINCODES (DataMeet)
  • datameet/Municipal_Spatial_Data (DataMeet)
  • NOAA VIIRS DNB (NOAA / EOG)
  • india-district-nightlights-viirs (yashveeeeeeer)
  • SHRUG (Development Data Lab)
  • indian_transport (ramSeraph)
  • INDIAN-SHAPEFILES (datta07)
  • indian_water_features (ramSeraph)
  • india_health_facilities (planemad)
  • Humanitarian OpenStreetMap (HOT) (HDX / OSM)
  • WorldPop (Univ. of Southampton)
  • FAO DSMW (FAO / UNESCO)
  • India Flood Inventory (HydroSense Lab, IIT Delhi)
  • India Flood Atlas (Water and Climate Lab, IIT Gandhinagar)
  • indian_buildings (ramSeraph)

政府数据来源包括: 印度测绘局、地方政务目录、ISRO Bhuvan、印度森林调查局、国家可持续海岸带管理中心、GatiShakti、eGramSwaraj、Swachh Bharat Mission、印度选举委员会、NOAA地球观测组、道路交通和公路部、印度铁路、水资源信息系统、国家信息中心、SLUSI、Jal Dharohar、AMRUT。

数据格式

格式 扩展名 使用场景
Parquet .parquet Python、R、DuckDB、QGIS中的列式分析
PMTiles .pmtiles 基于浏览器的地图查看、云优化瓦片
GeoJSONL .geojsonl.7z 流式 GeoJSON 处理(7z 压缩)
Shapefile .shp .dbf .shx .prj 传统 GIS 软件(QGIS, ArcGIS, MapInfo)
GeoJSON .geojson 网络地图、GitHub预览、轻量级分析
TopoJSON .topo.json 具有拓扑保存功能的紧凑网络地图
KML .kml Google Earth, Google Maps
CSV .csv 表格数据、电子表格
GeoTIFF .tif QGIS、Python (rasterio)、R 中的栅格分析

仓库结构与使用

  • 小文件:直接存储在本仓库的 data/ 目录下。
  • 大文件:通过 GitHub Releases 分发,每个发布标签对应一个数据类别。
  • 下载方式:可使用 gh release download 命令或辅助脚本 python scripts/download-releases.py 下载。
  • 目录结构:数据按类别组织在 data/ 下的子目录中,每个数据目录包含一个 README.md 文件和一个 metadata.json 文件。

法律声明

印度的官方政治地图以印度测绘局的地图为权威参考。本仓库在开放许可下聚合公开可用的地理空间数据,旨在用于研究、分析和教育目的。

搜集汇总
数据集介绍
main_image_url
构建方式
在印度地理信息科学领域,构建一个全面且结构化的数据集需要整合多源异构数据。India Geodata 通过系统化地收集来自政府门户、开放数据项目及研究机构的公开地理空间数据,实现了数据的统一与标准化。该数据集涵盖了行政边界、选举地图、人口普查几何、环境区域、水资源、基础设施网络、医疗、教育、城市市政数据等14个核心类别,总计超过1800个文件。数据构建过程遵循严格的验证流程,确保每一份数据都附带机器可读的元数据文档,并依据原始许可协议进行合规整合,从而形成一个可靠且易于访问的综合性地理信息库。
特点
India Geodata 的显著特点在于其广泛的数据覆盖范围和多样化的数据格式支持。数据集不仅包含了从国家到村庄的多级行政边界,还整合了环境、水文、基础设施及社会经济等多维度信息,提供了对印度地理空间的全面刻画。在技术层面,数据集以Parquet、PMTiles、GeoJSONL、Shapefile等多种格式提供,兼顾了高效列式分析、云端优化瓦片服务及传统GIS软件兼容性。这种多格式策略使得数据集能够适应从大规模数据分析到交互式网络地图的不同应用场景,同时通过压缩和分层存储优化了数据访问效率。
使用方法
对于研究人员和开发者而言,使用India Geodata 需要根据数据规模和具体需求选择相应的获取方式。小型文件可直接从GitHub仓库的`data/`目录中克隆或下载,而大型数据集如行政边界、森林覆盖等则通过GitHub Releases进行分发,用户可以使用`gh`命令行工具按类别或文件模式进行选择性下载。数据集支持在QGIS、ArcGIS等专业GIS软件中直接加载,也可通过Python的geopandas、R的sf等库进行编程分析。对于网络地图开发,PMTiles格式提供了高效的瓦片服务集成方案。用户在使用前应仔细查阅各子数据集的`metadata.json`文件以了解具体的许可协议和使用限制。
背景与挑战
背景概述
在数字时代,地理空间数据已成为支撑国家治理、经济发展与科学研究的关键基础设施。India Geodata 数据集由开发者 yashveeeeeeer 等人于2026年前后构建并维护,旨在整合印度境内分散且多源的地理空间信息。该数据集汇集了来自 Survey of India、DataMeet、NOAA 等多个权威机构与开源项目的开放数据,覆盖行政边界、选举地图、人口普查几何、环境分区、水资源、基础设施网络、医疗教育设施及城市市政数据等十余个类别。其核心研究问题在于解决印度地理空间数据长期存在的碎片化与访问壁垒,通过统一的结构化格式与开放许可,为政策分析、城市规划、环境监测及社会科学研究提供高质量、可互操作的数据基础,显著提升了相关领域数据驱动的决策能力与研究效率。
当前挑战
India Geodata 致力于应对印度地理空间数据分析中的核心挑战,即多源异构数据的集成与标准化问题。印度地理信息源自众多政府机构与项目,数据格式、坐标系与更新频率各异,导致跨领域综合分析困难重重。该数据集通过统一转换至 Parquet、PMTiles 等现代格式,并附载机器可读的元数据,旨在缓解这一瓶颈。在构建过程中,团队面临数据规模庞大、质量控制复杂及许可协议协调等多重挑战。数据集总量超过1,800个文件,涵盖约27GB的行政边界至20GB的基础设施数据,需处理大量几何验证、属性对齐与压缩存储问题。同时,整合来自CC BY 4.0、ODbL、印度OGL等不同许可的数据,要求严格遵守开源合规性,确保法律框架的清晰性与一致性。
常用场景
经典使用场景
在空间分析与区域规划领域,India Geodata数据集为研究者提供了印度全境多尺度、多主题的地理空间信息集成。其经典使用场景体现在将行政边界、人口普查几何、环境分区与基础设施网络等数据融合,支持跨领域的空间关联分析。例如,学者可结合行政区划与夜间灯光数据,探究区域经济发展与城市化进程的空间异质性,或整合水文网络与土地利用分类,评估流域生态系统的脆弱性。这类综合性分析依赖于数据集提供的统一坐标参考与标准化格式,确保了多源数据在GIS平台中的无缝集成与高效计算。
衍生相关工作
围绕该数据集衍生的经典工作,主要体现在方法创新与专题数据库扩展两方面。在方法上,研究者开发了基于PMTiles的流式地图服务架构,实现了大规模地理数据在Web端的实时可视化;另有工作利用Parquet列式存储优化了跨行政区统计的空间聚合性能。在专题扩展方面,学者结合SHRUG社会经济数据与地理边界,构建了村级多维贫困指数空间数据库;还有研究整合夜间灯光时序数据与选举边界,分析了政治周期与区域发展的关联性。这些衍生工作不仅丰富了印度空间数据生态,也为全球开放地理数据集成项目提供了可借鉴的技术范式。
数据集最近研究
最新研究方向
在印度地理空间数据领域,India Geodata作为统一的结构化数据集,正推动多学科交叉的前沿研究。当前研究聚焦于利用其高分辨率行政边界与夜间灯光数据,结合人口密度栅格,深入分析城市化进程中的社会经济动态与区域发展不均衡问题。环境科学领域则借助该数据集的水文与森林覆盖信息,模拟气候变化背景下的洪水风险与生态系统服务变化,为灾害预警与生态保护提供量化支撑。同时,基础设施与建筑足迹数据正被用于智慧城市研究与可持续交通规划,探索资源优化配置与低碳发展路径。这些研究不仅响应了印度国家地理空间政策对数据开放与创新的倡导,也为全球南方国家的空间数据科学应用提供了重要范例。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作