five

city-codes|地理信息数据集|数据标准化数据集

收藏
github2024-05-15 更新2024-05-31 收录
地理信息
数据标准化
下载链接:
https://github.com/datasets-br/city-codes
下载链接
链接失效反馈
资源简介:
包含巴西5570个城市的名称和官方代码,包括IBGE代码、wikidata IDs和URN LEX标签,以Simple Data Format Data Package形式提供。
创建时间:
2017-10-03
原始信息汇总

数据集概述

名称: city-codes

描述: 该数据集包含巴西城市代码的全面信息,包括IBGE代码、wikidata ID和URN LEX标签。数据以简单数据格式数据包提供,可通过datapackage.json进行可视化。

内容:

  • 巴西5570个城市的名称和官方代码。

数据更新

更新方式: 通过运行特定脚本来更新数据集,包括:

  • php src/etc/dumpWikidata.php 更新 [data/dump_wikidata] 中的 *.json 文件。
  • php src/dumpOsm.php geo 更新 [data/dump_osm] 中的 *.geojson 文件。

数据源

  • IBGE数据:ftp://geoftp.ibge.gov.br/organizacao_do_territorio/estrutura_territorial/divisao_territorial
  • 所有市政列表:https://pt.wikipedia.org/wiki/Lista_de_munic%C3%ADpios_do_Brasil
  • CEP

其他信息

AI搜集汇总
数据集介绍
main_image_url
构建方式
city-codes数据集的构建基于巴西各城市的官方代码信息,涵盖了IBGE代码、Wikidata ID以及URN LEX标签。该数据集通过整合来自IBGE、维基百科及Wikidata的多源数据,形成了一个全面的城市代码数据库。数据集的构建过程包括定期从Wikidata和OpenStreetMap中提取数据,并通过脚本进行更新,确保数据的时效性和准确性。
使用方法
使用city-codes数据集时,用户可以通过访问提供的datapackage.json文件进行数据预览和下载。数据集支持多种格式的数据导出,包括JSON和GeoJSON,便于在不同应用场景下的使用。用户还可以通过协作编辑工具对数据进行更新和维护,确保数据的持续更新与准确性。
背景与挑战
背景概述
在地理信息系统与城市管理领域,巴西的城市代码数据集(city-codes)应运而生,旨在为研究者与开发者提供全面的城市编码信息。该数据集由巴西的研究机构与开发者社区共同维护,涵盖了5570个巴西城市的官方代码,包括IBGE代码、Wikidata ID以及URN LEX标签。自创建以来,该数据集已成为地理信息系统、城市规划与数据分析等领域的重要资源,为跨学科研究提供了基础数据支持。
当前挑战
尽管city-codes数据集在提供城市编码信息方面具有显著优势,但其构建与维护过程仍面临诸多挑战。首先,数据来源的多样性,如IBGE、Wikidata及Wikipedia等,要求数据整合过程中需确保一致性与准确性。其次,随着巴西城市化进程的加速,城市代码的更新频率较高,如何实现数据的实时更新与同步成为一大难题。此外,数据格式的标准化与跨平台兼容性也是该数据集面临的挑战之一,以确保其在不同应用场景中的有效利用。
常用场景
经典使用场景
在地理信息系统和城市规划领域,city-codes数据集被广泛应用于城市代码的标准化与统一化处理。该数据集整合了巴西5570个城市的官方代码,包括IBGE代码、Wikidata ID以及URN LEX标签,为研究人员和开发者提供了便捷的城市信息查询与匹配服务。通过这些标准化的代码,用户可以轻松实现城市间的数据关联与对比分析,尤其在跨数据库的城市数据整合中表现尤为突出。
解决学术问题
city-codes数据集有效解决了城市代码标准化与统一化的学术难题。在地理信息系统(GIS)和城市规划研究中,不同数据源的城市代码往往存在不一致性,导致数据整合与分析的困难。该数据集通过提供统一的城市代码体系,显著提升了数据的可比性和可操作性,为跨区域、跨系统的城市数据分析提供了坚实的基础,推动了相关领域的研究进展。
实际应用
在实际应用中,city-codes数据集被广泛应用于政府决策支持系统、城市规划软件以及地理信息系统(GIS)平台。例如,政府部门可以利用该数据集进行城市间的资源分配与管理,确保数据的准确性与一致性;城市规划者则可以通过这些标准化代码,快速获取并整合不同城市的规划数据,优化城市发展策略。此外,该数据集还为物流、交通等行业的城市级数据处理提供了重要支持。
数据集最近研究
最新研究方向
在地理信息系统(GIS)和城市规划领域,city-codes数据集因其对巴西5570个城市的详细编码信息而备受关注。该数据集不仅包含了IBGE代码、Wikidata ID和URN LEX标签,还提供了与地理数据(如OpenStreetMap的geojson文件)的集成,这为城市地理信息的精细化管理和分析提供了坚实基础。近年来,随着智慧城市和空间数据基础设施的发展,city-codes数据集被广泛应用于城市地理编码的标准化、城市间数据对比分析以及跨平台数据整合等前沿研究。此外,数据集的协作更新机制和定期数据转储功能,进一步提升了其在动态城市数据管理中的应用价值,推动了巴西城市规划和地理信息系统的现代化进程。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

PlantVillage

在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。

OpenDataLab 收录