five

World Wealth and Income Database|收入分布数据集|财富研究数据集

收藏
github2024-04-29 更新2024-05-31 收录
收入分布
财富研究
下载链接:
https://github.com/datasets/world-wealth-and-income-database
下载链接
链接失效反馈
资源简介:
这是一个包含全球多个国家长时间段(如1875年至今)的收入份额数据的数据库,专注于高收入群体的收入分布。

This is a database containing income share data from multiple countries worldwide over a long period (e.g., from 1875 to the present), focusing on the income distribution of high-income groups.
创建时间:
2017-12-23
原始信息汇总

数据集概述

数据集内容

  • 主题: 该数据集包含全球多个国家长期时间段(如1875年至今)的收入份额数据,重点关注高收入群体。
  • 数据结构: 数据已转换为CSV格式,其中每列代表一个变量,国家和年份作为行。原始的xls文件已归档。

数据来源

  • 国家列表: 包括阿根廷、澳大利亚、加拿大、中国、丹麦、芬兰、法国、德国、印度、印度尼西亚、爱尔兰、意大利、日本、毛里求斯、荷兰、新西兰、挪威、葡萄牙、新加坡、南非、西班牙、瑞典、瑞士、坦桑尼亚、英国和美国等。
  • 数据更新: 数据由各国的研究人员根据特定研究更新,如Alvaredo, Facundo, Atkinson, Anthony B., Piketty, Thomas, 和 Saez, Emmanuel等。

数据使用

  • 许可信息: 数据可下载并用于研究目的,引用时需注明数据来源和访问日期。对于大规模数据再利用和非研究目的的使用,许可情况不明确。

数据更新与扩展

  • 未来计划: 数据库将持续更新,包括新的观测数据,并可能添加关于收入和财富分布的信息。
AI搜集汇总
数据集介绍
main_image_url
构建方式
世界财富与收入数据库(World Wealth and Income Database)通过整合全球多个国家的长期收入分配数据,构建了一个涵盖广泛时间跨度(如1875年至今)的详细收入份额时间序列。该数据库的构建基于一系列学术研究,特别是Piketty等人对法国长期收入分配的研究,逐步扩展至超过二十个国家的数据。数据来源包括各国税收数据和学术论文,通过系统化的整理和更新,形成了这一综合性的研究资源。
特点
该数据集的显著特点在于其时间跨度长、覆盖国家广泛,且数据内容详尽,涵盖了不同国家的收入分配情况。此外,数据集不仅关注收入分配,还逐步扩展至财富分配等领域,提供了多维度的分析视角。数据集的持续更新机制确保了其时效性和研究价值,为经济学和社会学领域的深入研究提供了坚实的基础。
使用方法
用户可以通过下载CSV格式的数据文件,直接进行数据分析和研究。数据集的结构设计使得每列代表一个变量,行则代表国家和年份,便于用户进行跨时间和跨国家的比较分析。在使用数据时,建议引用原始研究文献和数据库的访问日期,以确保学术规范和数据的可追溯性。此外,用户可根据研究需求,结合其他数据源进行扩展分析。
背景与挑战
背景概述
世界财富与收入数据库(World Wealth and Income Database)是由巴黎经济学院的托马斯·皮凯蒂(Thomas Piketty)等研究人员发起的一项重要研究项目,旨在提供全球范围内多个国家自1875年至今的收入分配数据。该数据库的核心研究问题集中在高收入群体的收入份额变化,尤其是通过税收数据进行长期分析。自2001年皮凯蒂对法国高收入群体的研究开始,该项目逐步扩展至超过二十个国家,成为研究收入不平等的重要资源。该数据库不仅为学术界提供了丰富的数据支持,还推动了对全球收入分配趋势的深入探讨,尤其在经济学和社会学领域产生了广泛影响。
当前挑战
世界财富与收入数据库在构建过程中面临多项挑战。首先,数据的收集和整理涉及多个国家的历史税收记录,不同国家的数据质量和可获得性存在显著差异,导致数据整合的复杂性增加。其次,随着时间的推移,收入分配的定义和测量方法也在不断变化,如何确保数据的连续性和一致性成为一大难题。此外,尽管该数据库提供了丰富的历史数据,但其更新速度和覆盖范围仍需进一步扩展,以应对全球经济环境的变化和新兴国家的需求。最后,数据的开放性和再利用性虽然得到了鼓励,但其版权和使用限制仍需明确,以促进更广泛的研究应用。
常用场景
经典使用场景
世界财富与收入数据库(World Wealth and Income Database)为研究全球收入分配不平等提供了丰富的历史数据。该数据集涵盖了多个国家从1875年至今的收入分配情况,特别是高收入群体的收入份额变化。研究者可以利用这些数据分析收入不平等的长期趋势,评估税收政策对收入分配的影响,以及探讨不同国家间收入分配模式的差异。
解决学术问题
该数据集解决了收入分配研究中的关键问题,如高收入群体的收入份额变化趋势、税收政策对收入不平等的影响以及不同国家收入分配模式的比较。通过提供长期的时间序列数据,研究者能够深入探讨收入不平等的历史演变,为政策制定提供科学依据,并对全球范围内的收入分配问题进行跨学科研究。
衍生相关工作
基于世界财富与收入数据库,许多经典研究工作得以展开。例如,Thomas Piketty 在其著作《21世纪资本论》中广泛引用了该数据库的数据,探讨了全球收入不平等的长期趋势。此外,许多学者利用该数据集进行跨国比较研究,分析不同国家收入分配模式的差异,并提出了多种政策建议,以应对日益加剧的收入不平等问题。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

Awesome JSON Datasets

一个精选的无需认证的JSON数据集列表。

github 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录

Traditional-Chinese-Medicine-Dataset-SFT

该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。

huggingface 收录

Oxford 102 Flowers

牛津102花卉数据集是一个主要用于图像分类的花卉集合数据集,分为102个类别,共102种花卉,其中每个类别包含40到258幅图像。 该数据集由牛津大学工程科学系2008年在相关论文 “大量类别上的自动花分类” 中发布

OpenDataLab 收录