five

Survey of Consumer Finances (SCF)|消费者财务数据集|数据分析数据集

收藏
Mendeley Data2024-01-31 更新2024-06-27 收录
消费者财务
数据分析
下载链接:
https://dataverse.harvard.edu/citation?persistentId=doi:10.7910/DVN/FRMKMF
下载链接
链接失效反馈
资源简介:
analyze the survey of consumer finances (scf) with r the survey of consumer finances (scf) tracks the wealth of american families. every three years, more than five thousand households answer a battery of questions about income, net worth, credit card debt, pensions, mortgages, even the lease on their cars. plenty of surveys collect annual income, only the survey of consumer finances captures such detailed asset data. responses are at the primary economic unit-level (peu) - the economically dominant, financially interdependent family members within a sampled household. norc at the university of chicago administers the data collection, but the board of governors of the federal reserve pay the bills and therefore call the shots. if you were so brazen as to open up the microdata and run a simple weighted median, you'd get the wrong answer. the five to six thousand respondents actually gobble up twenty-five to thirty thousand records in the final pub lic use files. why oh why? well, those tables contain not one, not two, but five records for each peu. wherever missing, these data are multiply-imputed, meaning answers to the same question for the same household might vary across implicates. each analysis must account for all that, lest your confidence intervals be too tight. to calculate the correct statistics, you'll need to break the single file into five, necessarily complicating your life. this can be accomplished with the `meanit` sas macro buried in the 2004 scf codebook (search for `meanit` - you'll need the sas iml add-on). or you might blow the dust off this website referred to in the 2010 codebook as the home of an alternative multiple imputation technique, but all i found were broken links. perhaps it's time for plan c, and by c, i mean free. read the imputation section of the latest codebook (search for `imputation`), then give these scripts a whirl. they've got that new r smell. the lion's share of the respondents in the survey of consumer finances get drawn from a pretty standard sample of american dwellings - no nursing homes, no active-duty military. then there's this secondary sample of richer households to even out the statistical noise at the higher end of the i ncome and assets spectrum. you can read more if you like, but at the end of the day the weights just generalize to civilian, non-institutional american households. one last thing before you start your engine: read everything you always wanted to know about the scf. my favorite part of that title is the word always. this new github repository contains t hree scripts: 1989-2010 download all microdata.R initiate a function to download and import any survey of consumer finances zipped stata file (.dta) loop through each year specified by the user (starting at the 1989 re-vamp) to download the main, extract, and replicate weight files, then import each into r break the main file into five implicates (each containing one record per peu) and merge the appropriate extract data onto each implicate save the five implicates and replicate weights to an r data file (.rda) for rapid future loading 2010 analysis examples.R prepare two survey of consumer finances-flavored multiply-imputed survey analysis functions load the r data files (.rda) necessary to create a multiply-imputed, replicate-weighted survey design demonstrate how to access the properties of a multiply-imput ed survey design object cook up some descriptive statistics and export examples, calculated with scf-centric variance quirks run a quick t-test and regression, but only because you asked nicely replicate FRB SAS output.R reproduce each and every statistic pr ovided by the friendly folks at the federal reserve create a multiply-imputed, replicate-weighted survey design object re-reproduce (and yes, i said/meant what i meant/said) each of those statistics, now using the multiply-imputed survey design object to highlight the statistically-theoretically-irrelevant differences click here to view these three scripts for more detail about the survey of consumer finances (scf), visit: the federal reserve board of governors' survey of consumer finances homepage the latest scf chartbook, to browse what's possible. (spoiler alert: everything.) the survey of consumer finances wikipedia entry the official frequently asked questions notes: nationally-representative statistics on the financial health, wealth, and assets of american hous eholds might not be monopolized by the survey of consumer finances, but there isn't much competition aside from the assets topical module of the survey of income and program participation (sipp). on one hand, the scf interview questions contain more detail than sipp. on the other hand, scf's smaller sample precludes analyses of acute subpopulations. and for any three-handed martians in the audience, ther e's also a few biases between these two data sources that you ought to consider. the survey methodologists at the federal reserve take their job seriously, as evidenced by this working paper trail. write a thank-you in their guestbook. one can never receive enough of those. confidential to sas, spss, stata, and sudaan users: the eighties called. they want their statistical languages back. time to transition to r. :D
创建时间:
2024-01-31
AI搜集汇总
数据集介绍
main_image_url
构建方式
Survey of Consumer Finances (SCF) 数据集由美国联邦储备系统定期进行,旨在全面捕捉美国家庭的财务状况。该数据集通过多阶段分层随机抽样方法,从全国范围内选取代表性家庭样本。调查内容涵盖家庭资产、负债、收入、支出等多个维度,确保数据的广泛性和代表性。数据收集过程严格遵循统计学原则,确保样本的无偏性和可靠性。
特点
SCF 数据集以其详尽性和权威性著称,提供了关于美国家庭财务状况的全面视角。其特点包括高频率的更新(每三年一次),确保数据的时代性;广泛的覆盖范围,涵盖不同收入水平、种族和地理位置的家庭;以及丰富的变量集,包括但不限于资产配置、债务结构和消费行为。这些特点使得SCF成为研究家庭金融行为和经济政策制定的宝贵资源。
使用方法
SCF 数据集适用于多种研究目的,包括但不限于家庭金融行为分析、收入不平等研究、以及宏观经济政策的评估。研究者可以通过访问SCF的官方网站获取数据,并利用统计软件进行数据清洗和分析。使用时,建议结合其他经济指标和时间序列数据,以增强研究的深度和广度。此外,SCF的数据开放性和详细的使用指南,使得即使是非专业人士也能有效利用该数据集进行研究。
背景与挑战
背景概述
Survey of Consumer Finances (SCF) 是由美国联邦储备系统自1983年起定期进行的全国性家庭财务状况调查。该数据集旨在提供关于美国家庭资产、负债、收入和消费行为的详细信息,为政策制定者、经济学家和研究人员提供关键数据支持。SCF的独特之处在于其对高收入家庭的深入调查,填补了其他调查数据在这一领域的空白。通过多年的积累,SCF已成为研究家庭金融行为和财富分配的重要资源,对理解经济不平等和制定相关政策具有深远影响。
当前挑战
SCF在构建过程中面临多项挑战。首先,数据收集的复杂性在于需要确保样本的代表性,以准确反映全国不同收入阶层和地区的家庭财务状况。其次,隐私保护和数据安全是重大关切,特别是在涉及敏感财务信息时。此外,随着经济环境的变化,如何持续更新调查方法以捕捉新兴金融产品和行为,也是一项持续的挑战。最后,数据分析的复杂性要求研究人员具备高度的专业技能,以从海量数据中提取有意义的见解。
发展历史
创建时间与更新
Survey of Consumer Finances (SCF) 数据集由美国联邦储备系统于1983年首次创建,旨在提供关于美国家庭财务状况的全面数据。该数据集每三年更新一次,最近一次更新是在2019年,反映了2019年的家庭财务状况。
重要里程碑
SCF 数据集的重要里程碑包括1992年的重大修订,引入了更详细的资产和负债分类,以及2007年增加了对金融衍生品和复杂金融工具的调查。此外,2010年的更新特别关注了金融危机后的家庭财务恢复情况,为政策制定者提供了宝贵的参考。
当前发展情况
当前,SCF 数据集已成为研究家庭财务行为、财富分配和金融稳定性的重要工具。其数据被广泛应用于经济学、金融学和社会学的研究中,为学术界和政策制定者提供了丰富的实证数据。SCF 的持续更新确保了其数据的相关性和时效性,对理解现代经济中的家庭财务动态具有重要意义。
发展历程
  • 首次发表,由美国联邦储备系统(Federal Reserve System)启动,旨在收集和分析美国家庭的财务状况数据。
    1946年
  • 首次应用,数据集被用于研究美国家庭的储蓄行为和财务健康状况。
    1950年
  • 重要里程碑,SCF进行了重大改革,引入了更广泛的财务指标和更详细的调查问卷,以提高数据的质量和覆盖面。
    1983年
  • 进一步扩展,SCF开始每三年进行一次调查,以提供更频繁的财务状况更新。
    1992年
  • 技术革新,引入了计算机辅助个人访谈(CAPI)技术,提高了数据收集的效率和准确性。
    2004年
  • 数据公开,SCF数据集开始通过互联网向公众开放,促进了学术研究和政策分析的使用。
    2010年
  • 最新进展,SCF继续更新和扩展其调查内容,以反映现代经济和金融环境的变化。
    2019年
常用场景
经典使用场景
在金融经济学领域,Survey of Consumer Finances (SCF) 数据集被广泛用于研究家庭财务状况和消费行为。该数据集通过详细的问卷调查,收集了美国家庭的资产、负债、收入、支出等关键财务信息。研究者利用这些数据分析家庭财富分布、消费模式、借贷行为以及金融决策的影响因素,为政策制定和学术研究提供了宝贵的实证依据。
衍生相关工作
SCF 数据集的广泛应用催生了大量相关的经典研究工作。例如,学者们基于SCF数据开发了多种家庭财务模型,用于预测家庭消费和储蓄行为。此外,SCF数据还被用于构建和验证金融脆弱性指数,帮助识别和评估家庭面临的金融风险。在政策研究领域,SCF数据为评估税收政策、社会保障政策和住房政策的影响提供了重要依据。这些衍生工作不仅丰富了金融经济学的理论体系,也为实际政策制定提供了科学支持。
数据集最近研究
最新研究方向
在金融经济学领域,Survey of Consumer Finances (SCF) 数据集因其对美国家庭财务状况的详尽记录而备受关注。最新研究方向聚焦于利用SCF数据进行财富分配不平等的深入分析,探讨不同收入阶层在经济周期中的表现差异。此外,研究者们正通过该数据集探索金融科技对家庭财务行为的影响,特别是数字支付和在线借贷服务的普及如何改变消费者的储蓄和投资模式。这些研究不仅有助于理解当前经济环境下的财富动态,还为政策制定者提供了宝贵的数据支持,以制定更有效的经济干预措施。
相关研究论文
  • 1
    The Survey of Consumer Finances (SCF) - A Comprehensive OverviewFederal Reserve Board · 2020年
  • 2
    Wealth Inequality in the United States since 1962: Evidence from Capitalized Income Tax DataNational Bureau of Economic Research · 2020年
  • 3
    The Role of Housing Wealth in the U.S. Economy: Evidence from the Survey of Consumer FinancesUniversity of Chicago Press · 2019年
  • 4
    The Impact of Student Loan Debt on Household Formation and HomeownershipUrban Institute · 2018年
  • 5
    The Distribution of Wealth in the United States: Evidence from the Survey of Consumer FinancesBrookings Institution · 2017年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

PCLT20K

PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。

arXiv 收录

FAOSTAT Agricultural Data

FAOSTAT Agricultural Data 是由联合国粮食及农业组织(FAO)提供的全球农业数据集。该数据集涵盖了农业生产、贸易、价格、土地利用、水资源、气候变化、人口统计等多个方面的详细信息。数据包括了全球各个国家和地区的农业统计数据,旨在为政策制定者、研究人员和公众提供全面的农业信息。

www.fao.org 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录