geobr_prep_data
收藏github2025-08-06 更新2025-08-07 收录
下载链接:
https://github.com/ipeaGIT/geobr_prep_data
下载链接
链接失效反馈官方服务:
资源简介:
该仓库用于准备通过geobr共享的数据,数据包括indiginous_land等,原始数据为.rds格式,处理后数据为.parquet格式。
This repository is designed to prepare the data shared through GeoBR, which includes indigenous land data among others. The original data is in .rds format, and the processed data is in .parquet format.
创建时间:
2025-08-04
原始信息汇总
数据集概述
数据集名称
geobr_prep_data
数据集结构
- data_raw
- indiginous_land
- 202901
- 原始文件(.rds格式)
- 202005
- 原始文件(.rds格式)
- 202901
- indiginous_land
- data
- indiginous_land
- 202901
- 处理后的文件(.parquet格式)
- 202005
- 处理后的文件(.parquet格式)
- 202901
- indiginous_land
数据类型
- 原始数据:.rds格式
- 处理后的数据:.parquet格式
数据内容
- 包含与土著土地相关的数据
搜集汇总
数据集介绍

构建方式
geobr_prep_data数据集通过系统化的数据采集与格式转换流程构建而成,原始数据以R语言专属的.rds格式存储于data_raw目录下,涵盖不同时间节点的土著土地信息。通过数据预处理环节,原始文件被高效转换为跨平台兼容的.parquet格式,并规范存储于data目录中,形成层次分明的版本化存储体系。
特点
该数据集以巴西地理空间信息为核心特色,采用双版本时间切片保存2020年和2019年的土著土地数据,确保时空维度的可追溯性。其创新性地运用列式存储的.parquet格式,在保持地理数据拓扑结构完整性的同时,显著提升了大数据环境下的读写效率,为空间分析提供了轻量化的数据支持。
使用方法
研究者可通过解析data目录中的.parquet文件快速获取地理空间数据,该格式兼容主流数据分析工具链。建议使用Apache Arrow或Pandas等支持Parquet的库进行数据加载,结合geobr等地理信息处理包可实现空间可视化与分析。不同年份版本数据的对比研究需注意目录结构的时序对应关系。
背景与挑战
背景概述
geobr_prep_data数据集由巴西地理空间研究团队于2020年前后构建,旨在系统化整理该国原住民土地边界等关键地理信息。该数据集以RDS原始文件为基础,通过标准化转换生成Parquet格式数据,为区域规划、生态保护等研究提供结构化地理数据支持。其核心价值在于解决了巴西本土地理信息分散存储、格式不统一的痛点,成为公共政策制定和学术研究的重要基础设施。
当前挑战
数据集构建面临双重挑战:在领域层面,需处理多时相原住民土地边界变更带来的时空数据对齐问题,这对地理信息系统的拓扑一致性校验提出极高要求;技术层面涉及从RDS到Parquet的跨格式转换,需确保投影坐标系、属性字段在格式迁移过程中的无损传递,特别是处理南美特殊坐标参考系时易出现元数据丢失现象。
常用场景
经典使用场景
在空间地理信息分析领域,geobr_prep_data数据集以其高效的数据存储格式和标准化的处理流程,成为研究人员进行巴西土著土地边界研究的经典工具。数据集提供的.parquet格式文件显著提升了大规模地理空间数据的读取效率,使得跨年度对比分析和空间叠加运算变得更为流畅。
实际应用
在实际应用中,政府部门借助该数据集监测土著领地变更情况,辅助制定区域发展规划;环保组织则利用其分析保护区与土著领地的空间关系,评估生态保护政策的实施效果。数据集的轻量化特性特别适合部署在资源有限的基层单位。
衍生相关工作
基于该数据集衍生的经典研究包括《巴西土著领地时空演变分析》等系列成果,这些工作不仅建立了土著领地变化监测模型,更发展出融合卫星遥感数据与行政边界数据的多源验证方法,推动了人文地理学定量研究范式的创新。
以上内容由遇见数据集搜集并总结生成



