World Wealth and Income Database|收入分布数据集|财富研究数据集

github2024-04-29 更新2024-05-31 收录

收入分布

财富研究

下载链接：

https://github.com/datasets/world-wealth-and-income-database

下载链接

链接失效反馈

资源简介：

这是一个包含全球多个国家长时间段（如1875年至今）的收入份额数据的数据库，专注于高收入群体的收入分布。

This is a database containing income share data from multiple countries worldwide over a long period (e.g., from 1875 to the present), focusing on the income distribution of high-income groups.

创建时间：

2017-12-23

原始信息汇总

数据集概述

数据集内容

主题: 该数据集包含全球多个国家长期时间段（如1875年至今）的收入份额数据，重点关注高收入群体。
数据结构: 数据已转换为CSV格式，其中每列代表一个变量，国家和年份作为行。原始的xls文件已归档。

数据来源

国家列表: 包括阿根廷、澳大利亚、加拿大、中国、丹麦、芬兰、法国、德国、印度、印度尼西亚、爱尔兰、意大利、日本、毛里求斯、荷兰、新西兰、挪威、葡萄牙、新加坡、南非、西班牙、瑞典、瑞士、坦桑尼亚、英国和美国等。
数据更新: 数据由各国的研究人员根据特定研究更新，如Alvaredo, Facundo, Atkinson, Anthony B., Piketty, Thomas, 和 Saez, Emmanuel等。

数据使用

许可信息: 数据可下载并用于研究目的，引用时需注明数据来源和访问日期。对于大规模数据再利用和非研究目的的使用，许可情况不明确。

数据更新与扩展

未来计划: 数据库将持续更新，包括新的观测数据，并可能添加关于收入和财富分布的信息。

AI搜集汇总

数据集介绍

构建方式

世界财富与收入数据库（World Wealth and Income Database）通过整合全球多个国家的长期收入分配数据，构建了一个涵盖广泛时间跨度（如1875年至今）的详细收入份额时间序列。该数据库的构建基于一系列学术研究，特别是Piketty等人对法国长期收入分配的研究，逐步扩展至超过二十个国家的数据。数据来源包括各国税收数据和学术论文，通过系统化的整理和更新，形成了这一综合性的研究资源。

特点

该数据集的显著特点在于其时间跨度长、覆盖国家广泛，且数据内容详尽，涵盖了不同国家的收入分配情况。此外，数据集不仅关注收入分配，还逐步扩展至财富分配等领域，提供了多维度的分析视角。数据集的持续更新机制确保了其时效性和研究价值，为经济学和社会学领域的深入研究提供了坚实的基础。

使用方法

用户可以通过下载CSV格式的数据文件，直接进行数据分析和研究。数据集的结构设计使得每列代表一个变量，行则代表国家和年份，便于用户进行跨时间和跨国家的比较分析。在使用数据时，建议引用原始研究文献和数据库的访问日期，以确保学术规范和数据的可追溯性。此外，用户可根据研究需求，结合其他数据源进行扩展分析。

背景与挑战

背景概述

世界财富与收入数据库（World Wealth and Income Database）是由巴黎经济学院的托马斯·皮凯蒂（Thomas Piketty）等研究人员发起的一项重要研究项目，旨在提供全球范围内多个国家自1875年至今的收入分配数据。该数据库的核心研究问题集中在高收入群体的收入份额变化，尤其是通过税收数据进行长期分析。自2001年皮凯蒂对法国高收入群体的研究开始，该项目逐步扩展至超过二十个国家，成为研究收入不平等的重要资源。该数据库不仅为学术界提供了丰富的数据支持，还推动了对全球收入分配趋势的深入探讨，尤其在经济学和社会学领域产生了广泛影响。

当前挑战

世界财富与收入数据库在构建过程中面临多项挑战。首先，数据的收集和整理涉及多个国家的历史税收记录，不同国家的数据质量和可获得性存在显著差异，导致数据整合的复杂性增加。其次，随着时间的推移，收入分配的定义和测量方法也在不断变化，如何确保数据的连续性和一致性成为一大难题。此外，尽管该数据库提供了丰富的历史数据，但其更新速度和覆盖范围仍需进一步扩展，以应对全球经济环境的变化和新兴国家的需求。最后，数据的开放性和再利用性虽然得到了鼓励，但其版权和使用限制仍需明确，以促进更广泛的研究应用。

常用场景

经典使用场景

世界财富与收入数据库（World Wealth and Income Database）为研究全球收入分配不平等提供了丰富的历史数据。该数据集涵盖了多个国家从1875年至今的收入分配情况，特别是高收入群体的收入份额变化。研究者可以利用这些数据分析收入不平等的长期趋势，评估税收政策对收入分配的影响，以及探讨不同国家间收入分配模式的差异。

解决学术问题

该数据集解决了收入分配研究中的关键问题，如高收入群体的收入份额变化趋势、税收政策对收入不平等的影响以及不同国家收入分配模式的比较。通过提供长期的时间序列数据，研究者能够深入探讨收入不平等的历史演变，为政策制定提供科学依据，并对全球范围内的收入分配问题进行跨学科研究。

衍生相关工作

基于世界财富与收入数据库，许多经典研究工作得以展开。例如，Thomas Piketty 在其著作《21世纪资本论》中广泛引用了该数据库的数据，探讨了全球收入不平等的长期趋势。此外，许多学者利用该数据集进行跨国比较研究，分析不同国家收入分配模式的差异，并提出了多种政策建议，以应对日益加剧的收入不平等问题。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

UniProt

UniProt（Universal Protein Resource）是全球公认的蛋白质序列与功能信息权威数据库，由欧洲生物信息学研究所（EBI）、瑞士生物信息学研究所（SIB）和美国蛋白质信息资源中心（PIR）联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名，整合了实验验证的高质量数据与大规模预测的自动注释内容，涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库（分为人工校验的Swiss-Prot和自动生成的TrEMBL），以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具，为基础研究和药物研发提供了无可替代的支持，成为生物学研究中不可或缺的资源。

www.uniprot.org 收录

中国区域地面气象要素驱动数据集 v2.0（1951-2020）

中国区域地面气象要素驱动数据集（China Meteorological Forcing Data，以下简称 CMFD）是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素，时间分辨率为 3 小时，水平空间分辨率为 0.1°，时间长度为 70 年（1951~2020 年），覆盖了 70°E~140°E，15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据，并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品，其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展，其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本，而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集，但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外，在制作 CMFD 2.0 的过程中，研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息，显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时，CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 70 年，并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同，但其有效数据扩展到了中国之外，能够更好地支持跨境区域研究。为方便用户使用，CMFD 2.0 还在基础变量集之外提供了若干衍生变量，包括近地面相对湿度、雨雪分离降水产品等。此外，CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术，转而直接将实型数据压缩存储于 NetCDF4 格式文件中，从而消除了用户使用数据时进行解压换算的困扰。本数据集原定版本号为 1.7，但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变，故将其版本号重新定义为 2.0。CMFD 2.0 的数据内容与此前宣传的 CMFD 1.7 基本一致，仅对 1983 年 7 月以后的向下短/长波辐射通量数据进行了更新，以修正其长期趋势存在的问题。2021 年至 2024 年的 CMFD 数据正在制作中，计划于 2025 年上半年发布，从而使 CMFD 2.0 延伸至 2024 年底。

国家青藏高原科学数据中心收录

FishBase Species List

FishBase Species List 是一个包含全球鱼类物种信息的全面数据库。该数据集提供了关于鱼类物种的详细信息，包括物种名称、分类学信息、分布区域、生态习性、繁殖行为、食性等。此外，数据集还包括了每个物种的图片和参考文献，以便用户进行深入研究。

www.fishbase.se 收录

Wind Turbine Data

该数据集包含风力涡轮机的运行数据，包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态，适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录

poi

本项目收集国内POI兴趣点，当前版本数据来自于openstreetmap。

github 收录