five

US H-1B Visa Lottery and Petition Data FY 2021 - FY 2024

收藏
github2024-08-01 更新2024-08-02 收录
下载链接:
https://github.com/BloombergGraphics/2024-h1b-immigration-data
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含美国H-1B签证抽签注册、选择和申请的数据,涵盖2021至2024财政年度。数据由美国公民及移民服务局提供,每行代表一个抽签注册,可能对应一个或多个雇主提交的多个注册。

This dataset contains data related to the registration, selection, and petition processing for the U.S. H-1B visa lottery, spanning fiscal years 2021 through 2024. The data is provided by the U.S. Citizenship and Immigration Services (USCIS). Each row in the dataset represents a single lottery registration, which may correspond to multiple registrations submitted by one or more employers.
创建时间:
2024-07-30
原始信息汇总

US H-1B Visa Lottery and Petition Data FY 2021 - FY 2024

背景

该数据由美国公民及移民服务局(USCIS)生成,该机构隶属于国土安全部,负责审理H-1B签证申请。每年四月,USCIS通过随机抽签决定哪些H-1B申请者可以提交完整的签证申请。

数据中的每一行代表一个抽签注册,每个候选人可以有多个由不同雇主提交的注册。一旦被选中,雇主可以代表受益人提交H-1B申请。对于签证申请,数据包括更多关于拟议工作的信息,如薪资、地点等。

批准的H-1B申请是获得H-1B签证的必要条件,但并不总是能获得签证。申请人收到USCIS的H-1B批准后,可以在美国领事馆申请H-1B签证,或者在美国境内申请身份调整。

文件描述

文件名 描述
TRK_13139_I129_H1B_Registrations_FY21_FY24_FOIA_FIN.xlsx 数据字典
TRK_13139_FY2021.csv FY 2021数据(2020年4月抽签)
TRK_13139_FY2022.csv FY 2022数据(2021年4月抽签)
TRK_13139_FY2023.csv FY 2023数据(2022年4月抽签)
TRK_13139_FY2024_single_reg.csv FY 2024数据(2023年4月抽签),单次注册
TRK_13139_FY2024_multi_reg.csv FY 2024数据(2023年4月抽签),多次注册
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集由Bloomberg News通过根据《信息自由法》对美国国土安全部提起诉讼后获得,涵盖了2021至2024财年的所有H-1B签证抽签注册、选择和申请数据。数据来源于美国公民及移民服务局(USCIS),该机构负责审理H-1B申请。每年四月,USCIS会进行随机抽签,以确定哪些H-1B申请者可以提交完整的签证申请。每条记录代表一个抽签注册,可能对应一个或多个雇主为同一候选人提交的多个注册。一旦被选中,雇主可以代表受益人提交H-1B申请,申请数据包括拟议工作的详细信息,如薪资和地点等。
特点
该数据集的一个显著特点是其详细记录了H-1B签证申请的整个流程,从抽签注册到最终的签证申请。此外,数据集还揭示了同一候选人可能由不同雇主提交多个注册的情况,这为研究H-1B签证系统的运作提供了丰富的视角。数据集的另一个特点是其时间跨度较长,涵盖了四个财年的数据,使得分析能够反映出H-1B签证政策和市场趋势的长期变化。
使用方法
用户可以通过该数据集重现Bloomberg News在相关报道中提出的发现,特别是关于中介机构如何利用系统漏洞获取大量工作签证的研究。数据集提供了详细的文件描述,用户可以根据财年选择相应的CSV文件进行分析。此外,数据字典文件提供了数据集的详细解释,帮助用户理解每个字段的含义。用户可以通过数据分析工具如Python的Pandas库或R语言进行数据处理和分析,以揭示H-1B签证系统的潜在问题和趋势。
背景与挑战
背景概述
美国H-1B签证抽签与申请数据集(FY 2021 - FY 2024)由Bloomberg News通过《信息自由法》诉讼从美国国土安全部获取。该数据集涵盖了2021至2024财年的所有H-1B抽签注册、选择及申请信息。美国公民及移民服务局(USCIS)负责审理H-1B申请,每年四月进行随机抽签,决定哪些申请人可以提交完整的签证申请。每条记录代表一个抽签注册,可能对应一个或多个雇主提交的多个注册。一旦被选中,雇主可以代表受益人提交H-1B申请,申请中包含拟议工作的详细信息,如薪资和地点等。
当前挑战
该数据集面临的挑战包括:首先,数据中每个注册可能对应多个雇主提交的多个注册,这增加了数据处理的复杂性。其次,尽管H-1B申请获批是获得H-1B签证的必要条件,但并非所有获批申请都能最终获得签证,这使得数据分析需考虑签证最终状态的不确定性。此外,数据集的构建过程中,需处理大量复杂的注册与申请信息,确保数据的准确性和完整性,这对数据清洗和处理技术提出了较高要求。
常用场景
经典使用场景
在分析美国H-1B签证抽签和申请数据时,研究者常利用该数据集来探讨签证抽签系统的公平性和效率。通过分析不同雇主提交的注册数量及其对应的抽签结果,研究者可以评估系统是否存在偏差,以及如何优化抽签机制以确保更公平的分配。此外,该数据集还可用于研究特定行业或地区对H-1B签证的需求变化,从而为政策制定者提供有价值的参考。
解决学术问题
该数据集为学术界提供了宝贵的资源,用以解决关于移民政策和劳动力市场动态的多个研究问题。通过分析H-1B签证的申请和批准数据,学者们可以深入探讨签证政策对美国劳动力市场的影响,包括对特定行业技能需求的影响以及对本地劳动力市场的竞争效应。此外,该数据集还为研究签证抽签系统的公平性和效率提供了实证基础,有助于推动相关政策的优化和改进。
衍生相关工作
基于该数据集,已有多项经典工作在移民政策和劳动力市场研究领域取得了显著成果。例如,有研究通过分析不同年份的H-1B签证申请数据,揭示了签证政策变化对特定行业就业市场的影响。此外,还有研究利用该数据集探讨了签证抽签系统中的公平性问题,提出了改进建议。这些衍生工作不仅丰富了学术研究,也为政策制定者提供了重要的参考依据。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务