datasets
收藏github2019-06-17 更新2024-05-31 收录
下载链接:
https://github.com/hay/datasets
下载链接
链接失效反馈官方服务:
资源简介:
该仓库包含了我多年来收集和创建的几个数据集。
This repository contains several datasets that I have collected and created over the years.
创建时间:
2018-05-05
原始信息汇总
数据集列表
1. amsterdam-buurtcodes.csv
- 描述: 包含荷兰阿姆斯特丹市的stadsdelen, buurtcombinaties 和 buurten 的代码。主要来源于此官方公告。
2. gtaa-full.csv
- 描述: 2015年3月的GTAA数据转储,包含changeNote, scopeNote, hiddenLabel, inScheme 和 prefLabel 字段。
3. museumkaart-museums-aug2018.csv
- 描述: 2018年8月,所有接受Museumkaart的荷兰博物馆列表,来源自此页面。
4. nl-gemeentes-cbs-wikidata.csv
- 描述: 所有荷兰市镇,包含Wikidata ID和根据CBS在2016年1月1日的统计人口。
5. nl-temperatures-average.csv
- 描述: 1706年至2014年荷兰每月平均气温,来源自wintergek.nl。
6. rce_mip_objecten_mdb.(csv|json|xlsx)
- 描述: Monumenten Inventarisatie Project (MIP)的数据库,包含1850年至1940年间的152,400个荷兰建筑。数据转换自此Access数据库,提供CSV, JSON和Excel格式。
7. rijksmonumenten-2018-11-06.zip
- 描述: 2018年11月6日所有荷兰Rijksmonumenten的SQL转储,转换自Access数据库,转换过程中可能存在数据丢失。
8. temperatures-de-bilt-2017.csv
- 描述: 2017年在De Bilt每日平均气温,来源自KNMI。
搜集汇总
数据集介绍

构建方式
该数据集的构建涉及对多个来源的数据进行搜集与整合,包括官方发布的数据文本、网络页面信息以及专业数据库的转换。如‘amsterdam-buurtcodes.csv’是根据荷兰阿姆斯特丹市官方公布的信息整理而成,‘nl-gemeentes-cbs-wikidata.csv’则是结合了荷兰中央统计局和维基数据的信息。此外,‘rce_mip_objecten_mdb’系列数据集是从专业数据库转换而来,包含了大量荷兰建筑的历史数据。
使用方法
用户可根据自身需求选择相应格式的数据集进行下载。数据集多采用CSV等通用格式,易于导入至数据分析软件中处理。针对特定格式的数据,如SQL或Excel,用户需使用相应的软件或工具进行读取和分析。此外,部分数据集可能包含转换过程中的错误,使用时需注意数据完整性和准确性,必要时可参考原始数据源进行核实。
背景与挑战
背景概述
该数据集名为datasets,是一组由研究人员在多年时间内搜集和创建的数据集集合。其中包含了多个子数据集,涉及荷兰阿姆斯特丹地区的行政区划代码、GTAA ids的旧数据快照、接受博物馆卡的荷兰博物馆列表、荷兰市镇与人口统计、荷兰月平均气温历史数据、荷兰1850至1940年建筑物的Monumenten Inventarisatie Project (MIP)数据库,以及荷兰国家纪念碑的SQL数据转储。这些数据集的创建旨在为相关研究提供结构化的数据资源,对于地理信息系统、历史文化保护、气候变化研究等领域具有重要的研究价值。
当前挑战
数据集构建过程中遇到的挑战主要包括:1)如何将非结构化的文本数据转化为结构化的数据格式;2)数据整合与清洗,以确保数据的一致性和准确性;3)数据集的时效性问题,需要定期更新以保持其参考价值;4)数据转换过程中的错误处理,如从Access数据库转换为SQL时出现的错误,可能导致数据缺失或不完整。此外,所解决的领域问题包括为研究提供精确的地理位置数据、历史建筑信息以及气候变化趋势分析,但同时也面临着如何提高数据集的可用性和易用性的挑战。
常用场景
经典使用场景
在地理信息系统与城市规划研究中,datasets数据集提供了丰富的荷兰地区编码、博物馆信息、温度记录等数据资源。其经典使用场景在于,研究者能够借助如`amsterdam-buurtcodes.csv`精细化的区域编码数据,对阿姆斯特丹市进行地块级别的分析与规划。
解决学术问题
该数据集解决了地区编码数据结构化不足、博物馆数据不全面、历史温度数据缺乏等问题。例如,`nl-gemeentes-cbs-wikidata.csv`整合了荷兰各市镇的Wikidata ID和人口数据,为人口统计分析提供了宝贵的结构化数据源,极大地便利了学术研究的进行。
实际应用
在现实应用中,这些数据不仅能够服务于政府机构进行更为精准的市政管理,还能辅助旅游行业提供更为详尽的博物馆信息,如`museumkaart-museums-aug2018.csv`所提供的博物馆列表即是一例。
数据集最近研究
最新研究方向
在地理信息系统与文化遗产保护领域,以datasets数据集为基础的研究正逐渐深入。该数据集涵盖了荷兰阿姆斯特丹地区的行政区划代码、博物馆信息、平均气温记录以及历史建筑数据等。近期研究集中于利用这些数据探索城市化进程中的历史变迁,以及数字化技术在文化遗产管理与展示中的应用。特别是'rce_mip_objecten_mdb'子数据集,其包含的荷兰建筑数据被用于分析19世纪至20世纪中叶的建筑风格演变,以及评估自然灾害对文化遗产的影响。此类研究不仅有助于历史与文化遗产的数字化保护,同时也为城市规划与可持续发展提供了重要参考。
以上内容由遇见数据集搜集并总结生成



