five

world-cities

收藏
github2024-05-10 更新2024-05-31 收录
下载链接:
https://github.com/datasets/world-cities
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界上人口超过15,000的城市列表,每个城市都关联了其所属国家和次级行政区,以减少歧义。次级行政区可以是州名或主要行政区划名。数据来源于geonames网站,每个城市还提供了唯一标识符geonameid。

This dataset comprises a list of cities worldwide with populations exceeding 15,000. Each city is associated with its respective country and sub-administrative region to minimize ambiguity. The sub-administrative region may be a state name or a major administrative division. The data is sourced from the geonames website, and each city is provided with a unique identifier, geonameid.
创建时间:
2016-02-13
原始信息汇总

数据集概述

数据来源

  • 数据提取自geonames,一个包含全球地名的详尽列表。

数据内容

  • 本数据集仅列出人口超过15,000的城市。
  • 每个城市关联其国家和次级行政区,以减少名称的模糊性。
  • 次级行政区可以是州名(如英国或美国)或主要行政区(如法国的“地区”)。
  • 对于像梵蒂冈城或新加坡这样的城市,由于它们是独立的国家,因此次级行政区标记为“N/A”。
  • 数据集提供每个城市的源数据主键“geonameid”,以解决可能的名称重复问题。

数据使用许可

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建基于全球地理名称数据库[geonames],从中提取了人口超过15,000的主要城市信息。每个城市数据不仅包含其名称,还关联了所属国家和次国家行政区,以减少名称歧义。次国家行政区可以是州、省或主要行政区域,具体定义可参考[geonames]网站的`admin1`字段。此外,部分城市如梵蒂冈城和新加坡因其特殊性,次国家行政区标记为'N/A'。数据处理过程中,使用了[dataflows]工具对数据进行规范化处理,确保数据的准确性和一致性。
使用方法
使用该数据集时,用户需先安装相关依赖,通过运行`pip install -r scripts/requirements.txt`命令完成。随后,执行`python scripts/process.py`脚本进行数据处理。数据集的输出格式经过规范化,便于直接导入各类数据分析工具。在使用过程中,需遵循Creative Common Attribution License,确保在使用数据时注明来源,并可选择性地对[Lexman]和[Open Knowledge Foundation]表示感谢。
背景与挑战
背景概述
世界城市数据集(world-cities)是由Open Knowledge Foundation和Lexman等研究人员创建的,旨在提供全球主要城市的详细信息。该数据集的核心来源是Geonames,一个涵盖全球地名的详尽数据库。数据集筛选出人口超过15,000的城市,并为其分配国家及次国家级别的行政区划信息,以减少城市名称的歧义。此外,数据集还提供了每个城市的唯一标识符‘geonameid’,以确保数据的唯一性和可追溯性。该数据集的创建不仅为地理信息系统、城市规划和人口研究等领域提供了宝贵的资源,还为全球范围内的数据分析和应用奠定了基础。
当前挑战
世界城市数据集在构建过程中面临多项挑战。首先,全球范围内城市名称的重复性较高,尤其是在人口密集的国家和地区,这导致了城市名称的歧义问题。尽管数据集通过引入‘geonameid’和次国家级别的行政区划信息来缓解这一问题,但仍需进一步优化以提高数据的准确性。其次,数据集的更新和维护也是一个持续的挑战,尤其是随着城市人口的变化和新兴城市的出现,数据集需要定期更新以保持其时效性和可靠性。此外,数据集的国际化处理,如不同语言和文化的城市名称标准化,也是一项复杂且耗时的任务。
常用场景
经典使用场景
world-cities数据集的经典使用场景主要体现在地理信息系统(GIS)和全球城市研究领域。该数据集提供了全球主要城市的详细信息,包括城市名称、所属国家和次国家行政区划,特别适用于需要精确地理定位和城市分类的应用。例如,在构建全球城市数据库或进行城市间比较研究时,该数据集能够提供基础数据支持,帮助研究者快速获取城市的地理和行政信息。
解决学术问题
该数据集解决了全球城市研究中的多个学术问题,特别是在城市地理学和区域研究领域。通过提供全球主要城市的详细信息,它有助于研究者进行城市人口分布、城市化进程和区域经济发展等方面的分析。此外,数据集中的次国家行政区划信息为跨区域比较研究提供了便利,增强了研究的深度和广度。
实际应用
在实际应用中,world-cities数据集被广泛用于地理信息系统、旅游规划、市场分析和物流管理等领域。例如,在旅游规划中,该数据集可以帮助确定全球主要旅游城市的分布和行政区划,从而优化旅游路线和资源配置。在市场分析中,数据集的城市信息可用于识别潜在市场和客户群体,支持商业决策。
数据集最近研究
最新研究方向
在地理信息系统(GIS)和城市研究领域,world-cities数据集因其对全球主要城市的详细记录而备受关注。该数据集不仅提供了城市名称、所属国家和次国家行政区划等基本信息,还通过geonameid确保了数据的唯一性,这对于解决城市名称歧义问题具有重要意义。近年来,该数据集在前沿研究中被广泛应用于城市网络分析、人口流动模拟以及全球城市化趋势预测等方向。特别是在全球城市化进程加速的背景下,研究人员利用该数据集进行跨国城市比较、城市群动态分析以及城市可持续发展策略的制定,为政策制定者和城市规划者提供了宝贵的数据支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作