five

US H-1B Visa Lottery and Petition Data FY 2021 - FY 2024|H-1B签证数据集|移民数据数据集

收藏
github2024-08-01 更新2024-08-02 收录
H-1B签证
移民数据
下载链接:
https://github.com/BloombergGraphics/2024-h1b-immigration-data
下载链接
链接失效反馈
资源简介:
该数据集包含美国H-1B签证抽签注册、选择和申请的数据,涵盖2021至2024财政年度。数据由美国公民及移民服务局提供,每行代表一个抽签注册,可能对应一个或多个雇主提交的多个注册。
创建时间:
2024-07-30
原始信息汇总

US H-1B Visa Lottery and Petition Data FY 2021 - FY 2024

背景

该数据由美国公民及移民服务局(USCIS)生成,该机构隶属于国土安全部,负责审理H-1B签证申请。每年四月,USCIS通过随机抽签决定哪些H-1B申请者可以提交完整的签证申请。

数据中的每一行代表一个抽签注册,每个候选人可以有多个由不同雇主提交的注册。一旦被选中,雇主可以代表受益人提交H-1B申请。对于签证申请,数据包括更多关于拟议工作的信息,如薪资、地点等。

批准的H-1B申请是获得H-1B签证的必要条件,但并不总是能获得签证。申请人收到USCIS的H-1B批准后,可以在美国领事馆申请H-1B签证,或者在美国境内申请身份调整。

文件描述

文件名 描述
TRK_13139_I129_H1B_Registrations_FY21_FY24_FOIA_FIN.xlsx 数据字典
TRK_13139_FY2021.csv FY 2021数据(2020年4月抽签)
TRK_13139_FY2022.csv FY 2022数据(2021年4月抽签)
TRK_13139_FY2023.csv FY 2023数据(2022年4月抽签)
TRK_13139_FY2024_single_reg.csv FY 2024数据(2023年4月抽签),单次注册
TRK_13139_FY2024_multi_reg.csv FY 2024数据(2023年4月抽签),多次注册
AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集由Bloomberg News通过根据《信息自由法》对美国国土安全部提起诉讼后获得,涵盖了2021至2024财年的所有H-1B签证抽签注册、选择和申请数据。数据来源于美国公民及移民服务局(USCIS),该机构负责审理H-1B申请。每年四月,USCIS会进行随机抽签,以确定哪些H-1B申请者可以提交完整的签证申请。每条记录代表一个抽签注册,可能对应一个或多个雇主为同一候选人提交的多个注册。一旦被选中,雇主可以代表受益人提交H-1B申请,申请数据包括拟议工作的详细信息,如薪资和地点等。
特点
该数据集的一个显著特点是其详细记录了H-1B签证申请的整个流程,从抽签注册到最终的签证申请。此外,数据集还揭示了同一候选人可能由不同雇主提交多个注册的情况,这为研究H-1B签证系统的运作提供了丰富的视角。数据集的另一个特点是其时间跨度较长,涵盖了四个财年的数据,使得分析能够反映出H-1B签证政策和市场趋势的长期变化。
使用方法
用户可以通过该数据集重现Bloomberg News在相关报道中提出的发现,特别是关于中介机构如何利用系统漏洞获取大量工作签证的研究。数据集提供了详细的文件描述,用户可以根据财年选择相应的CSV文件进行分析。此外,数据字典文件提供了数据集的详细解释,帮助用户理解每个字段的含义。用户可以通过数据分析工具如Python的Pandas库或R语言进行数据处理和分析,以揭示H-1B签证系统的潜在问题和趋势。
背景与挑战
背景概述
美国H-1B签证抽签与申请数据集(FY 2021 - FY 2024)由Bloomberg News通过《信息自由法》诉讼从美国国土安全部获取。该数据集涵盖了2021至2024财年的所有H-1B抽签注册、选择及申请信息。美国公民及移民服务局(USCIS)负责审理H-1B申请,每年四月进行随机抽签,决定哪些申请人可以提交完整的签证申请。每条记录代表一个抽签注册,可能对应一个或多个雇主提交的多个注册。一旦被选中,雇主可以代表受益人提交H-1B申请,申请中包含拟议工作的详细信息,如薪资和地点等。
当前挑战
该数据集面临的挑战包括:首先,数据中每个注册可能对应多个雇主提交的多个注册,这增加了数据处理的复杂性。其次,尽管H-1B申请获批是获得H-1B签证的必要条件,但并非所有获批申请都能最终获得签证,这使得数据分析需考虑签证最终状态的不确定性。此外,数据集的构建过程中,需处理大量复杂的注册与申请信息,确保数据的准确性和完整性,这对数据清洗和处理技术提出了较高要求。
常用场景
经典使用场景
在分析美国H-1B签证抽签和申请数据时,研究者常利用该数据集来探讨签证抽签系统的公平性和效率。通过分析不同雇主提交的注册数量及其对应的抽签结果,研究者可以评估系统是否存在偏差,以及如何优化抽签机制以确保更公平的分配。此外,该数据集还可用于研究特定行业或地区对H-1B签证的需求变化,从而为政策制定者提供有价值的参考。
解决学术问题
该数据集为学术界提供了宝贵的资源,用以解决关于移民政策和劳动力市场动态的多个研究问题。通过分析H-1B签证的申请和批准数据,学者们可以深入探讨签证政策对美国劳动力市场的影响,包括对特定行业技能需求的影响以及对本地劳动力市场的竞争效应。此外,该数据集还为研究签证抽签系统的公平性和效率提供了实证基础,有助于推动相关政策的优化和改进。
衍生相关工作
基于该数据集,已有多项经典工作在移民政策和劳动力市场研究领域取得了显著成果。例如,有研究通过分析不同年份的H-1B签证申请数据,揭示了签证政策变化对特定行业就业市场的影响。此外,还有研究利用该数据集探讨了签证抽签系统中的公平性问题,提出了改进建议。这些衍生工作不仅丰富了学术研究,也为政策制定者提供了重要的参考依据。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

Google Scholar

Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。

scholar.google.com 收录

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

VoxBox

VoxBox是一个大规模语音语料库,由多样化的开源数据集构建而成,用于训练文本到语音(TTS)系统。

github 收录

HIT-UAV

HIT-UAV数据集包含2898张红外热成像图像,这些图像从43,470帧无人机拍摄的画面中提取。数据集涵盖了多种场景,如学校、停车场、道路和游乐场,在不同的光照条件下,包括白天和夜晚。

github 收录