five

PSID|家庭经济数据集|社会行为数据集

收藏
psidonline.isr.umich.edu2024-10-27 收录
家庭经济
社会行为
下载链接:
https://psidonline.isr.umich.edu/
下载链接
链接失效反馈
资源简介:
PSID(Panel Study of Income Dynamics)是一个长期的家庭收入动态研究项目,旨在跟踪和分析美国家庭的经济和社会行为。数据集包括家庭收入、财富、就业、教育、健康等多个方面的信息。
提供机构:
psidonline.isr.umich.edu
AI搜集汇总
数据集介绍
main_image_url
构建方式
PSID数据集的构建基于对美国家庭的长期追踪调查,始于1968年,由密歇根大学社会研究所负责。该数据集通过每两年一次的问卷调查,收集了大量关于家庭结构、经济状况、教育水平、健康状况等多维度的信息。数据收集过程中,研究人员采用了多阶段抽样方法,确保样本的代表性和广泛性,同时通过严格的隐私保护措施,确保受访者的个人信息安全。
特点
PSID数据集以其长期性和全面性著称,涵盖了超过50年的数据,为社会科学研究提供了宝贵的纵向数据资源。其特点在于数据的连续性和可比性,使得研究者能够追踪同一家庭或个体在不同时期的变化。此外,PSID数据集包含了丰富的社会经济变量,为多学科研究提供了广泛的应用空间,特别是在经济学、社会学和人口学领域。
使用方法
使用PSID数据集时,研究者首先需要根据研究目的选择合适的样本和变量。数据集提供了详细的代码本和用户指南,帮助用户理解和处理数据。研究者可以通过多种统计软件如Stata、R等进行数据分析,利用时间序列分析、回归分析等方法探索变量之间的关系。此外,PSID数据集还支持跨年度的数据合并和比较,为长期趋势分析提供了便利。
背景与挑战
背景概述
家庭动态调查(Panel Study of Income Dynamics, PSID)是由密歇根大学社会研究所于1968年创建的一项长期纵向研究项目。该数据集旨在深入探讨家庭收入、财富积累、消费行为以及社会经济地位的动态变化。PSID的核心研究问题包括家庭收入不平等、贫困动态、劳动力市场参与以及社会政策的影响。通过持续追踪同一家庭及其后代,PSID为经济学、社会学和公共政策研究提供了宝贵的数据资源,极大地推动了相关领域的理论发展和实证研究。
当前挑战
PSID数据集在构建和应用过程中面临多项挑战。首先,长期纵向追踪导致数据缺失和样本流失问题,影响研究的连续性和代表性。其次,数据隐私和伦理问题要求严格的数据保护措施,增加了数据管理的复杂性。此外,跨时间段的变量定义和测量方法的一致性也是一大挑战,确保数据的可比性和准确性。最后,数据集的庞大体量和高维度特征增加了数据分析的计算复杂性和技术要求,对研究者的数据处理能力提出了更高要求。
发展历史
创建时间与更新
PSID(Panel Study of Income Dynamics)数据集创建于1968年,由密歇根大学社会研究所发起,旨在研究美国家庭的收入动态。该数据集自创建以来,每年进行更新,至今已积累了超过半个世纪的纵向数据。
重要里程碑
PSID数据集的重要里程碑包括1997年引入的财富补充调查,该调查首次系统地收集了美国家庭的财富信息,极大地丰富了数据集的内容。此外,2003年引入的健康与退休研究(HRS)补充调查,进一步扩展了数据集在健康和退休领域的应用。这些里程碑不仅提升了数据集的学术价值,也为政策制定提供了重要依据。
当前发展情况
当前,PSID数据集已成为社会科学研究中的重要资源,广泛应用于经济学、社会学、人口学等多个领域。其长期纵向数据为研究家庭收入、财富积累、健康状况等提供了宝贵的资料。近年来,PSID数据集还通过与国际数据集的整合,扩展了其全球影响力,为跨国比较研究提供了可能。此外,数据集的开放获取政策也促进了学术交流和合作,推动了相关领域的知识进步。
发展历程
  • 首次发表,由密歇根大学社会研究所启动,旨在研究美国家庭的经济和社会变迁。
    1968年
  • 首次应用,开始对初始样本中的4800个家庭进行追踪调查。
    1969年
  • 引入计算机辅助个人访谈(CAPI)技术,提升数据收集效率和准确性。
    1997年
  • 扩展至包括西班牙裔和亚裔家庭,增强数据集的多样性和代表性。
    2003年
  • 发布PSID-CDS(Child Development Supplement),专注于儿童发展的长期追踪数据。
    2017年
常用场景
经典使用场景
在社会科学领域,PSID(Panel Study of Income Dynamics)数据集被广泛用于研究家庭收入、财富积累及消费行为等经济现象。通过长期追踪同一家庭的经济状况,PSID为学者提供了丰富的纵向数据,使得研究者能够深入分析经济变量随时间的变化趋势及其影响因素。
衍生相关工作
基于PSID数据集,许多经典的社会科学研究得以开展。例如,Smeeding和Gottschalk(1993)利用PSID数据研究了美国收入不平等的长期趋势;Meyer和Sullivan(2017)则通过PSID数据分析了贫困的动态变化。这些研究不仅丰富了社会经济学的理论框架,也为实际政策制定提供了科学依据。
数据集最近研究
最新研究方向
在家庭经济学和社会政策领域,PSID(Panel Study of Income Dynamics)数据集的最新研究方向主要集中在家庭收入动态的长期趋势分析。研究者们利用PSID的纵向数据,深入探讨了收入不平等、贫困率变化以及社会福利政策对家庭经济状况的长期影响。这些研究不仅揭示了家庭收入结构的演变,还为政策制定者提供了关于如何更有效地设计社会福利和收入支持计划的宝贵见解。此外,PSID数据还被用于分析教育、健康和劳动力市场参与等因素对家庭经济动态的交互作用,从而为跨学科研究提供了丰富的数据支持。
相关研究论文
  • 1
    The Panel Study of Income Dynamics: A Twenty-Year EvaluationNational Bureau of Economic Research · 1991年
  • 2
    The Intergenerational Transmission of Inequality: An Empirical Study Using the Panel Study of Income DynamicsUniversity of Michigan · 2019年
  • 3
    Long-Term Effects of Early Childhood Programs: Evidence from the Panel Study of Income DynamicsUniversity of Chicago · 2020年
  • 4
    The Role of Education in Economic Mobility: Evidence from the Panel Study of Income DynamicsAmerican Economic Association · 2021年
  • 5
    Health and Economic Outcomes in the United States: Evidence from the Panel Study of Income DynamicsHarvard University · 2022年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

GAOKAO-Bench

GAOKAO-Bench是由复旦大学计算机科学与技术学院创建的数据集,涵盖了2010至2022年间中国高考的所有科目题目,共计2811题。该数据集包含1781道客观题和1030道主观题,题型多样,包括单选、填空、改错、开放性问题等。数据集通过自动化脚本和人工标注将PDF格式的题目转换为JSON文件,数学公式则转换为LATEX格式。GAOKAO-Bench旨在为大型语言模型提供一个全面且贴近实际应用的评估基准,特别是在解决中国高考相关问题上的表现。

arXiv 收录

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

LibriSpeech

LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。

OpenDataLab 收录

中国行政区划数据

本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。

github 收录