five

hkdatasets

收藏
github2024-03-02 更新2024-05-31 收录
下载链接:
https://github.com/Hong-Kong-Districts-Info/hkdatasets
下载链接
链接失效反馈
官方服务:
资源简介:
该数据包包含关于香港的数据集,如香港区议员信息、街道名称、区划概要以及交通事故数据等。这些数据集旨在通过数据科学使公共信息更易于访问和使用。

This dataset package contains information about Hong Kong, including details on district council members, street names, district outlines, and traffic accident data. These datasets are designed to make public information more accessible and usable through data science.
创建时间:
2020-08-19
原始信息汇总

数据集概述

hkdatasets 是一个包含与香港相关数据集的R数据包。该包作为 Hong Kong Districts Info 项目的一部分开发,旨在通过数据科学使公共信息更易于访问和消费。

包含的数据集

  1. hkdc

    • 描述:包含2019年选举的香港区议员信息。
    • 变量:包括选区、地区、得票率、总票数、Facebook页面链接等。
    • 来源:香港区议会HK01
  2. hkstreetnames20

    • 描述:包含2020年香港所有街道名称的数据集。
  3. hkdistrict_summary

    • 描述:详细介绍香港各区及其区域分类和缩写标签的汇总表。
  4. hk_accidents

    • 描述:包含2014至2019年间的交通意外数据集。
    • 关联:可通过 Serial_No_ 变量与其他相关数据集(hk_casualtieshk_vehicles)连接。
    • 来源:通过向 香港运输署 提出的信息自由请求获得。
  5. hk_casualties

    • 描述:包含2014至2019年间因碰撞导致的伤亡信息数据集。
  6. hk_vehicles

    • 描述:包含2014至2019年间涉及伤亡的车辆信息数据集。

数据集版本变更

  • 自版本 1.0.0 起,hk_accidents, hk_casualties, 和 hk_vehicles 数据集仅可通过 download_data() 函数访问,不再直接作为命名空间提供,此变更由于CRAN的尺寸限制。

安装信息

  • 可通过CRAN安装: R install.packages("hkdatasets")

  • 或从GitHub安装最新开发版本: R install.packages("devtools") devtools::install_github("Hong-Kong-Districts-Info/hkdatasets")

使用建议

  • 推荐从2019年区议员数据集开始探索: R library(hkdatasets) head(hkdc)

  • 可通过 ?hkdc 了解更多关于数据集的变量和来源信息。

联系方式

搜集汇总
数据集介绍
main_image_url
构建方式
hkdatasets数据集由香港地区信息项目组开发,旨在通过数据科学手段提升公共信息的可访问性和可消费性。该数据集整合了多个来源的数据,包括香港区议会议员信息、街道名称、区域摘要以及交通事故相关数据。其中,交通事故数据通过向香港运输部门提交信息自由请求获取,并利用{HK80}包将HK1980GRID坐标系统转换为经纬度。数据集构建过程中,注重数据的准确性和完整性,确保其能够为研究提供可靠的基础。
特点
hkdatasets数据集涵盖了香港多个领域的信息,具有多样性和广泛性。数据集中的`hkdc`提供了2019年香港区议会议员的详细信息,包括选区、得票率等;`hkstreetnames20`则包含了2020年香港所有街道的名称;`hkdistrict_summary`总结了香港各区的区域分类和缩写标签。此外,交通事故相关数据集(`hk_accidents`、`hk_casualties`、`hk_vehicles`)可通过`Serial_No_`字段进行关联,为交通研究提供了丰富的数据支持。数据集还支持UTF-8编码,确保中文字符的正确显示。
使用方法
hkdatasets数据集可通过R语言进行安装和使用。用户可以通过CRAN安装稳定版本,或通过GitHub安装最新开发版本。安装完成后,用户可通过`library(hkdatasets)`加载数据集,并使用`head(hkdc)`等命令查看数据内容。数据集中的变量和来源信息可通过`?hkdc`等命令查询。对于较大的数据集(如交通事故数据),用户需使用`download_data()`函数进行下载。数据集的使用方法简单直观,适合各类研究需求。
背景与挑战
背景概述
hkdatasets是由Hong Kong Districts Info项目组开发的一个R语言数据包,旨在通过数据科学手段提升香港公共信息的可访问性与可消费性。该数据集包含了多个与香港相关的子数据集,如2019年香港区议会议员信息、2020年香港街道名称、香港各区摘要以及2014年至2019年的交通事故数据等。这些数据通过公开渠道获取,部分数据如交通事故信息是通过香港运输部门的《信息自由法》请求获得。该数据集的创建不仅为研究者提供了丰富的香港本地数据资源,还通过数据整合与转换工具(如HK80包)提升了数据的可用性与分析价值。
当前挑战
hkdatasets在构建与应用过程中面临多重挑战。首先,数据获取的合法性与透明度是关键问题,尤其是通过《信息自由法》请求获取的交通事故数据,需确保数据的完整性与准确性。其次,数据整合与转换的技术挑战不容忽视,例如将HK1980GRID坐标系统转换为经纬度坐标,需要依赖外部工具并确保转换的精确性。此外,由于CRAN对数据包大小的限制,部分数据集如交通事故数据无法直接包含在命名空间中,需通过特定函数下载,这增加了用户的使用复杂度。最后,数据中包含的中文字符编码问题也需要妥善处理,以确保数据的兼容性与可读性。
常用场景
经典使用场景
hkdatasets数据集在社会科学和城市规划领域具有广泛的应用。研究者常利用该数据集中的香港区议员信息、街道名称和交通事故数据,进行选举行为分析、城市空间结构研究以及交通安全评估。例如,通过分析`hkdc`数据集中的选举数据,可以深入了解香港各区选民的政治倾向和投票行为。
解决学术问题
hkdatasets数据集为研究者提供了丰富的香港本地数据资源,解决了数据获取困难的问题。通过整合交通事故、车辆和伤亡数据,研究者能够进行深入的交通安全研究,揭示事故发生的规律和影响因素。此外,数据集中的地理信息转换功能,使得研究者能够更便捷地进行空间数据分析,推动了城市规划和管理领域的研究进展。
衍生相关工作
hkdatasets数据集衍生了许多相关研究和工作。例如,基于该数据集的交通事故数据,研究者开发了多种交通安全预测模型,为政府决策提供了科学依据。此外,数据集中的香港区议员信息被广泛应用于政治学和公共管理领域的研究,推动了选举行为和公共政策分析的深入发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作