five

Awesome Indonesia Public Datasets|印度尼西亚数据集|公共数据集数据集

收藏
github2022-08-01 更新2024-05-31 收录
印度尼西亚
公共数据集
下载链接:
https://github.com/Banyuwangi45/Awesome-Public-Datasets
下载链接
链接失效反馈
资源简介:
该仓库提供印度尼西亚地区的公共数据集,包括国家、部门、关于印度尼西亚的各类数据以及特定地区和城市的数据。

This repository provides public datasets for the Indonesian region, encompassing national, departmental, and various data pertaining to Indonesia, as well as data specific to particular regions and cities.
创建时间:
2019-10-08
原始信息汇总

数据集概述

数据集名称

Awesome Indonesia Public Datasets

数据集描述

该数据集提供了印度尼西亚地区的公共数据集,涵盖了国家、地区、城市等多个层面的数据资源。

数据集内容

国家数据源

  • Badan Pusat Statistik (BPS): 印度尼西亚国家统计局。
  • Badan Informasi Geospasial (BIG): 地理空间信息局。
  • Satu Data Indonesia: 印度尼西亚政府数据门户。
  • Pusat Data Desa Indonesia: 印度尼西亚村庄数据中心。
  • Kata Data: 数据分析平台。

部门数据源

  • Satu Data Perencanaan Pembangunan: 国家发展规划数据。
  • Pusat Data Kementrian Kesehatan: 卫生部数据中心。

关于印度尼西亚的数据

  • data.world: 印度尼西亚数据集。
  • data.worldbank.org: 世界银行印度尼西亚数据。
  • wri-indonesia.org: 世界资源研究所印度尼西亚资源。
  • data.humdata.org: 人道主义数据交换印度尼西亚数据。
  • world data atlas: Knoema提供的印度尼西亚数据集。

地区数据源

  • D.K.I. Jakarta: 雅加达特区数据。
  • West Java: 西爪哇省数据。
  • Center Java: 中爪哇省数据。

城市数据源

  • Jakarta: 雅加达市数据。
  • Bandung: 万隆市数据。

统计数据

  • Statistics Indonesia (BPS): 提供印度尼西亚各省份的统计数据。

政府和政治数据

  • Election: 印度尼西亚选举数据集。
  • Government: 印度尼西亚各级政府数据。

Bappenas dan Bappeda

  • Bappenas: 国家发展规划局数据。

调查机构

  • Lingkar Survei Indonesia: 印度尼西亚调查机构。
  • Saiful Mujani Research and Consulting: 研究咨询公司。
  • Indikator: 数据分析公司。
  • Charta Politika: 政治分析机构。
  • Litbang Kompas: Kompas数据研究。

数据集链接

数据集图片

参考资料

AI搜集汇总
数据集介绍
main_image_url
构建方式
Awesome Indonesia Public Datasets 数据集的构建方式主要依赖于从印尼各地的政府机构、统计部门以及公共数据平台收集数据。这些数据涵盖了从国家到地方的多个层级,包括省级、市级以及特定地区的统计数据。数据来源包括印尼国家统计局(Badan Pusat Statistik)、地理信息局(Badan Informasi Geospasial)以及其他政府部门的公开数据平台。通过整合这些来源的数据,构建了一个全面且多层次的公共数据集,旨在为研究者、开发者以及政策制定者提供丰富的数据资源。
特点
该数据集的特点在于其广泛的地理覆盖范围和多样的数据类型。数据集不仅包含了印尼全国范围内的统计数据,还细分到各个省份、城市以及特定区域,涵盖了人口、经济、社会、地理等多个领域的数据。此外,数据集还提供了政府和政治相关的数据,如选举数据和政府机构信息,使其在社会科学研究、政策分析以及数据驱动的决策中具有重要价值。
使用方法
使用 Awesome Indonesia Public Datasets 数据集时,用户可以通过访问 GitHub 仓库中的链接,直接获取所需的数据资源。数据集中的每个数据源都提供了详细的链接和描述,用户可以根据自己的需求选择相应的数据进行下载和分析。此外,数据集还提供了一些参考资料和工具,帮助用户更好地理解和利用这些数据。对于开发者而言,数据集的结构化格式和丰富的数据类型为构建数据驱动的应用程序提供了良好的基础。
背景与挑战
背景概述
Awesome Indonesia Public Datasets 是一个汇集了印度尼西亚地区公共数据集的资源库,旨在为研究人员、开发者和政策制定者提供丰富的数据资源。该数据集由Banyuwangi45团队创建,涵盖了从国家到地方各级政府、统计机构、地理信息系统等多个领域的数据。其核心研究问题在于如何通过整合和开放这些数据,促进印度尼西亚的社会经济发展和政策制定。该数据集的创建不仅为学术研究提供了宝贵的资源,也为政府决策和公共服务的优化提供了数据支持。
当前挑战
该数据集面临的挑战主要包括数据的多样性和复杂性。首先,印度尼西亚作为一个多岛屿国家,各地区的数据分布不均,整合这些数据需要克服地理和文化差异。其次,数据的更新和维护也是一个重要挑战,确保数据的时效性和准确性对于研究者和决策者至关重要。此外,数据的隐私和安全问题也需要得到妥善处理,以确保公共数据的使用不会侵犯个人或机构的权益。
常用场景
经典使用场景
Awesome Indonesia Public Datasets 数据集的经典使用场景主要集中在社会经济分析、政策制定和学术研究领域。通过整合印尼各地区的公共数据,研究者可以深入分析区域经济发展、人口统计、教育水平、医疗资源分布等关键指标。这些数据为政府决策提供了科学依据,同时也为学术界提供了丰富的研究素材,特别是在区域发展不平衡、城乡差距等问题的研究中具有重要价值。
解决学术问题
该数据集解决了印尼地区在社会经济研究中的数据匮乏问题,尤其是在区域差异、政策效果评估和公共资源分配等领域的研究中。通过提供详细的区域统计数据,研究者能够更准确地分析印尼各地区的经济结构、社会发展水平和政策执行效果,从而为学术界提供了有力的数据支持。这不仅有助于深化对印尼社会经济现象的理解,还为政策制定者提供了科学依据,推动了区域发展的均衡性。
衍生相关工作
基于 Awesome Indonesia Public Datasets 数据集,衍生了许多相关的经典工作,特别是在区域经济分析、社会政策评估和公共健康研究领域。例如,有学者利用该数据集研究了印尼各地区的贫困分布与经济发展之间的关系,提出了针对性的扶贫政策建议;还有研究者通过分析医疗资源分布数据,评估了不同地区的健康服务水平,并提出了优化医疗资源配置的方案。这些研究不仅丰富了学术界的知识库,也为实际政策制定提供了有力支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

PCLT20K

PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。

arXiv 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

Obstacle-dataset OD

该数据集用于十五种障碍物检测,包含VOC格式和YOLO训练的.txt文件,数据集中的图像来自VOC数据集、COCO数据集、TT100K数据集以及作者团队实地收集的图片。

github 收录

中国区域地面气象要素驱动数据集 v2.0(1951-2020)

中国区域地面气象要素驱动数据集(China Meteorological Forcing Data,以下简称 CMFD)是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素,时间分辨率为 3 小时,水平空间分辨率为 0.1°,时间长度为 70 年(1951~2020 年),覆盖了 70°E~140°E,15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据,并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品,其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展,其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本,而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集,但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外,在制作 CMFD 2.0 的过程中,研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息,显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时,CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 70 年,并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同,但其有效数据扩展到了中国之外,能够更好地支持跨境区域研究。为方便用户使用,CMFD 2.0 还在基础变量集之外提供了若干衍生变量,包括近地面相对湿度、雨雪分离降水产品等。此外,CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术,转而直接将实型数据压缩存储于 NetCDF4 格式文件中,从而消除了用户使用数据时进行解压换算的困扰。 本数据集原定版本号为 1.7,但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变,故将其版本号重新定义为 2.0。CMFD 2.0 的数据内容与此前宣传的 CMFD 1.7 基本一致,仅对 1983 年 7 月以后的向下短/长波辐射通量数据进行了更新,以修正其长期趋势存在的问题。2021 年至 2024 年的 CMFD 数据正在制作中,计划于 2025 年上半年发布,从而使 CMFD 2.0 延伸至 2024 年底。

国家青藏高原科学数据中心 收录