Health and Retirement Study (HRS)
收藏DataONE2015-04-11 更新2024-06-27 收录
下载链接:
https://search.dataone.org/view/sha256:3a2a9aa1a26e46d56c6bdce9246d51753034f9258650097cad3bf32bcbbb256a
下载链接
链接失效反馈官方服务:
资源简介:
analyze the health and retirement study (hrs) with r the hrs is the one and only longitudinal survey of american seniors. with a panel starting its third decade, the current pool of respondents includes older folks who have been interviewed every two years as far back as 1992. unlike cross-sectional or shorter panel surveys, respondents keep responding until, well, death d o us part. paid for by the national institute on aging and administered by the university of michigan's institute for social research, if you apply for an interviewer job with them, i hope you like werther's original. figuring out how to analyze this data set might trigger your fight-or-flight synapses if you just start clicking arou nd on michigan's website. instead, read pages numbered 10-17 (pdf pages 12-19) of this introduction pdf and don't touch the data until you understand figure a-3 on that last page. if you start enjoying yourself, here's the whole book. after that, it's time to register for access to the (free) data. keep your username and password handy, you'll need it for the top of the download automation r script. next, look at this data flowchart to get an idea of why the data download page is such a righteous jungle. but wait, good news: umich recently farmed out its data management to the rand corporation, who promptly constructed a giant consolidated file with one record per respondent across the whole panel. oh so beautiful. the rand hrs files make much of the older data and syntax examples obsolete, so when you come across stuff like instructions on how to merge years, you can happily ignore them - rand has done it for you. the health and retirement study only includes noninstitutionalized adults when new respondents get added to the panel (as they were in 1992, 1993, 1998, 2004, and 2010) but once they're in, they're in - respondents have a weight of zero for interview waves when they were nursing home residents; but they're still responding and will continue to contribute to your statistics so long as you're generalizing about a population from a previous wave (for example: it's possible to compute \"among all americans who were 50+ years old in 1998, x% lived in nursing homes by 2010\"). my source for that 411? page 13 of the design doc. wicked. this new github repository contains five scripts: 1992 - 2010 download HRS microdata.R loop through every year and every file, download, then unzip everything in one big party impor t longitudinal RAND contributed files.R create a SQLite database (.db) on the local disk load the rand, rand-cams, and both rand-family files into the database (.db) in chunks (to prevent overloading ram) longitudinal RAND - analysis examples.R connect to the sql database created by the 'import longitudinal RAND contributed files' program create tw o database-backed complex sample survey object, using a taylor-series linearization design perform a mountain of analysis examples with wave weights from two different points in the panel import example HRS file.R load a fixed-width file using only the sas importation script directly into ram with < a href=\"http://blog.revolutionanalytics.com/2012/07/importing-public-data-with-sas-instructions-into-r.html\">SAScii parse through the IF block at the bottom of the sas importation script, blank out a number of variables save the file as an R data file (.rda) for fast loading later replicate 2002 regression.R connect to the sql database created by the 'import longitudinal RAND contributed files' program create a database-backed complex sample survey object, using a taylor-series linearization design exactly match the final regression shown in this document provided by analysts at RAND as an update of the regression on pdf page B76 of this document . click here to view these five scripts for more detail about the health and retirement study (hrs), visit: michigan's hrs homepage rand's hrs homepage the hrs wikipedia page a running list of publications using hrs notes: exemplary work making it this far. as a reward, here's the detailed codebook for the main rand hrs file. note that rand also creates 'flat files' for every survey wave, but really, most every analysis you c an think of is possible using just the four files imported with the rand importation script above. if you must work with the non-rand files, there's an example of how to import a single hrs (umich-created) file, but if you wish to import more than one, you'll have to write some for loops yourself. confidential to sas, spss, stata, and sudaan users: a tidal wave is coming. you can get water up your nose and be dragged out to sea, or you can grab a surf board. time to transition to r. :D
使用R语言开展健康与退休研究(Health and Retirement Study, HRS)的数据分析工作。HRS是全球唯一针对美国老年群体的纵向追踪调查项目。该追踪面板已进入第三个十年,当前的受访对象群体包含自1992年起每两年接受一次访谈的老年受访者。与横断面调查或短期追踪调查不同,受访者将持续参与调查直至离世。
本项目由美国国家老龄化研究所(National Institute on Aging)资助,密歇根大学社会研究所(Institute for Social Research)负责执行。如果你申请成为他们的访调员,恐怕会爱上沃瑟原味糖果(Werther's Original)。
若你直接在密歇根大学的官网随意点击探索,可能会在着手分析该数据集时感到手足无措。反之,请先阅读这份介绍文档的第10至17页(PDF页码为12至19),在理解最后一页的图A-3之前,切勿触碰原始数据。如果你渐入佳境,可以获取完整的手册。完成学习后,即可注册获取免费的数据集。请妥善保管你的用户名与密码,后续在编写下载自动化R脚本时将用到它们。接下来,可以查看这份数据流程图,了解为何数据集下载页面会如此错综复杂。
不过别担心,密歇根大学近期已将数据管理工作外包给兰德公司(Rand Corporation),后者迅速搭建了一套整合度极高的数据集,其中每个受访者在整个追踪面板中仅对应一条记录,堪称完美。兰德公司的HRS数据集让大量旧版数据与语法示例失去了使用价值,因此当你遇到诸如"如何合并不同年份数据"的指导内容时,大可忽略——兰德公司已经替你完成了数据整合工作。
健康与退休研究在新增面板受访者时(如1992、1993、1998、2004与2010年的新增对象),仅纳入非机构化成年人。但一旦受访者加入面板,便会持续保留身份:若受访者在某一轮访谈时处于疗养院居住状态,则其在该轮的权重为0,但他们仍会被视为研究对象,并可在基于既往调查波次的总体推断中继续贡献数据。例如:你可以计算"1998年时年龄在50岁及以上的美国人群中,有X%在2010年时居住在疗养院"。我关于该细节的信息来源?是设计文档的第13页,十分实用。
本GitHub仓库包含五个R脚本:
1. **1992-2010下载HRS微观数据.R**:遍历每一年与每一个文件,完成下载并批量解压。
2. **导入纵向兰德贡献数据集.R**:在本地磁盘创建SQLite数据库(.db格式),分批次将兰德HRS、兰德CAMS以及所有兰德家族数据集导入该数据库(避免内存过载)。
3. **纵向兰德数据分析示例.R**:连接由"导入纵向兰德贡献数据集"程序生成的SQL数据库,基于泰勒级数线性化设计创建两个基于数据库的复杂抽样调查对象,结合不同调查波次的权重开展大量分析示例。
4. **导入示例HRS文件.R**:仅通过SAS导入脚本,使用<a href="http://blog.revolutionanalytics.com/2012/07/importing-public-data-with-sas-instructions-into-r.html">SAScii</a>工具将固定宽度文件直接加载至内存,解析SAS导入脚本底部的IF语句块,清空部分变量,最终将文件保存为R数据文件(.rda格式)以实现后续快速加载。
5. **复现2002年回归分析.R**:连接由"导入纵向兰德贡献数据集"程序生成的SQL数据库,基于泰勒级数线性化设计创建基于数据库的复杂抽样调查对象,精准复现兰德公司分析师提供的文档中展示的最终回归分析结果——该文档是对本手册PDF第B76页回归分析的更新。
点击此处查看这五个脚本。想要了解更多关于健康与退休研究(HRS)的细节,请访问:
- 密歇根大学HRS官方主页
- 兰德公司HRS官方主页
- HRS维基百科页面
- 使用HRS开展研究的已发表论文汇总列表
备注:
恭喜你顺利完成至此步骤。作为奖励,这里提供兰德HRS主数据集的详细代码本。需要注意的是,兰德公司还为每一轮调查创建了"扁平文件",但实际上,你所能想到的绝大多数分析仅需使用上述兰德导入脚本导入的四个文件即可完成。若你必须使用非兰德公司的原始数据集,本仓库提供了单份密歇根大学原生HRS文件的导入示例,但如果你需要导入多份文件,则需自行编写循环脚本。
致SAS、SPSS、Stata与SUDAAN用户:一场数据浪潮即将来袭。你要么被呛水并卷入深海,要么就拿起冲浪板顺势而为——是时候转向R语言了。:D
创建时间:
2023-11-21
搜集汇总
数据集介绍

构建方式
Health and Retirement Study (HRS) 数据集的构建基于对美国中老年人群的长期追踪调查。该数据集始于1992年,由密歇根大学社会研究所主导,通过多阶段的概率抽样方法,从美国各州选取代表性样本。调查内容涵盖健康状况、经济状况、家庭关系等多个维度,采用面对面访谈和自我报告相结合的方式收集数据。每两年进行一次更新,确保数据的时效性和连续性。
使用方法
HRS 数据集适用于多种研究目的,包括但不限于健康经济学、老年学和社会政策分析。研究者可以通过访问官方网站获取数据,并需遵循相应的使用协议。数据预处理步骤包括清洗、标准化和变量选择,以确保分析的准确性。常用的分析方法包括回归分析、生存分析和结构方程模型,以揭示健康与经济之间的复杂关系。
背景与挑战
背景概述
Health and Retirement Study (HRS) 是由美国国家老龄化研究所(NIA)于1992年发起的一项纵向研究,旨在探讨美国50岁及以上人群的健康状况、经济状况以及退休决策。该数据集由密歇根大学社会研究所(ISR)负责管理,汇集了大量关于老年人口的社会经济和健康数据。HRS的核心研究问题包括老年人的健康变化、退休决策的影响因素以及长期护理需求等,对老年学、公共卫生和经济学等领域产生了深远影响。
当前挑战
HRS数据集在构建过程中面临多项挑战。首先,数据收集涉及多维度的复杂变量,如健康状况、经济活动和家庭结构,这要求高度的数据整合和标准化处理。其次,纵向研究的时间跨度长,数据随时间变化的不一致性和缺失值处理成为主要难题。此外,隐私保护和数据安全在涉及个人敏感信息时尤为重要,需严格遵守相关法律法规。最后,数据分析需克服样本老化和样本流失问题,以确保研究结果的可靠性和代表性。
发展历史
创建时间与更新
Health and Retirement Study (HRS) 数据集创建于1992年,旨在研究美国老年人的健康状况和退休行为。该数据集定期更新,最近一次主要更新是在2020年,涵盖了截至2018年的数据。
重要里程碑
HRS数据集的重要里程碑包括1998年的首次全国代表性样本扩展,以及2004年引入的基因数据收集,这标志着该数据集在生物医学研究中的应用深化。此外,2012年HRS与多个国际老龄化研究项目合作,进一步提升了其在全球老龄化研究中的影响力。
当前发展情况
当前,HRS数据集已成为全球老龄化研究的重要资源,其数据被广泛应用于公共卫生、经济学和社会学等多个领域。HRS不仅提供了丰富的纵向数据,还通过与国际研究项目的合作,推动了跨文化老龄化研究的发展。此外,HRS的持续更新和扩展,确保了其在应对老龄化社会挑战中的前沿地位。
发展历程
- Health and Retirement Study (HRS) 首次发表,作为一项纵向研究,旨在调查美国老年人的健康状况和退休情况。
- HRS 首次应用,开始收集数据以分析老年人的健康、经济状况和退休决策。
- HRS 扩展了其研究范围,开始包括配偶和未成年子女的数据,以更全面地了解家庭动态。
- HRS 引入了基因数据,成为首个结合遗传信息的大型纵向研究,以探索基因与健康之间的关系。
- HRS 开始与国际长寿中心合作,推动全球老龄化研究,并分享其数据和方法。
- HRS 发布了其第12轮数据,继续为政策制定者和研究人员提供关于老年人健康和福祉的宝贵见解。
常用场景
经典使用场景
在老龄化社会研究领域,Health and Retirement Study (HRS) 数据集被广泛用于分析老年人的健康状况、退休决策及其经济影响。该数据集通过长期追踪调查,提供了丰富的个体和家庭层面的数据,使得研究者能够深入探讨年龄、健康、收入和退休之间的复杂关系。
解决学术问题
HRS 数据集解决了老龄化研究中的多个关键学术问题,如老年人健康状况的动态变化、退休决策的经济动机以及长期护理需求预测。通过提供高质量的纵向数据,HRS 帮助学者们建立了关于老年人生活质量、经济保障和医疗利用的全面理解,推动了相关领域的理论和实证研究。
实际应用
在实际应用中,HRS 数据集为政策制定者提供了宝贵的参考信息。例如,通过分析HRS数据,政府可以更准确地评估老年人的医疗需求,优化医疗保险政策。此外,金融机构利用HRS数据来开发针对老年人的金融产品,如退休储蓄计划和长期护理保险,从而更好地满足老年人的经济和健康需求。
数据集最近研究
最新研究方向
在老龄化社会背景下,Health and Retirement Study (HRS) 数据集的研究方向日益聚焦于老年人口的健康与经济状况的动态变化。近期研究主要集中在探索老年人口的健康行为与经济决策之间的相互影响,以及这些因素如何随时间演变。此外,研究者们还关注于利用HRS数据集进行跨代际分析,以揭示家庭内部资源分配与代际支持的模式。这些研究不仅有助于理解老年人口的生活质量,还为政策制定者提供了宝贵的数据支持,以优化养老保障和健康服务体系。
相关研究论文
- 1The Health and Retirement Study: A Longitudinal Study of Health, Retirement, and AgingUniversity of Michigan · 2006年
- 2The Role of Health in the Age-Wealth Profile: Evidence from the Health and Retirement StudyUniversity of Southern California · 2018年
- 3Health and Retirement: Do Changes in Health Affect Retirement Expectations?National Bureau of Economic Research · 2015年
- 4Health Shocks and Household Asset Holdings: Evidence from the Health and Retirement StudyUniversity of California, Berkeley · 2017年
- 5The Impact of Health on Labor Force Participation: Evidence from the Health and Retirement StudyUniversity of Chicago · 2019年
以上内容由遇见数据集搜集并总结生成



