five

JobHop

收藏
Hugging Face2025-05-19 更新2025-05-20 收录
下载链接:
https://huggingface.co/datasets/aida-ugent/JobHop
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个由佛兰德斯公共就业服务VDAB提供的超过40万匿名简历衍生的职业经验大规模公开数据集。该数据集通过使用小型语言模型(LLM)提取信息,并将每段工作经验映射到相应的ESCO代码。数据集包括以下字段:person_id(表示行属于哪个简历的标识符)、esco_code(与提取的经验相对应的ESCO代码)、start_date和end_date(与工作经历相关的日期)、university_degree(表示个人是否拥有大学学位的标志)。
创建时间:
2025-05-12
搜集汇总
数据集介绍
main_image_url
构建方式
基于比利时弗兰德斯公共就业服务机构VDAB提供的36万余份匿名简历,该数据集通过小型语言模型提取职业经历信息,并借助Nobl.ai专有工具将每条工作经历映射至欧洲技能、能力、资格和职业分类体系编码。数据清洗过程中对模糊职位标签进行了标准化处理,确保职业轨迹记录的准确性与一致性。
使用方法
研究者可借助该数据集开展职业转型模式分析、技能需求预测等实证研究。使用时应通过个人标识符追踪纵向职业路径,结合起始日期字段构建动态职业网络。需注意数据已进行匿名化处理,且部分模糊职位被标记为未知类别,建议配合原始论文披露的清洗方法进行数据验证。
背景与挑战
背景概述
劳动力市场分析领域长期面临职业轨迹数据稀缺的挑战,JobHop数据集应运而生。该数据集由根特大学研究团队于2025年创建,基于比利时法兰德斯公共就业服务局VDAB提供的36万份匿名简历构建,采用小型语言模型与专业工具进行ESOC职业编码映射。其核心价值在于通过大规模真实职业经历数据,为职业流动性研究、技能需求预测等关键问题提供实证基础,对劳动经济学与计算社会科学领域产生深远影响。
当前挑战
职业轨迹分析需解决跨行业技能转换模式识别的复杂性,以及职业分类体系动态更新的适配性问题。在构建过程中,研究团队面临原始简历信息抽取的语义歧义挑战,特别是非标准化职位描述的编码映射困难。数据清洗阶段需处理时间戳不完整与职业标签模糊等数据质量问题,这些技术难点直接影响职业路径建模的精确度与泛化能力。
常用场景
经典使用场景
在劳动力市场分析领域,JobHop数据集凭借其源自36万份匿名简历的职业轨迹数据,为研究职业流动模式提供了重要基础。该数据集通过ESCO职业分类体系对工作经历进行标准化编码,使研究者能够系统分析不同行业间的职业转换规律,尤其适用于探索经济结构调整对就业市场的影响。
解决学术问题
该数据集有效解决了职业发展研究中数据规模不足的瓶颈问题,为量化分析职业路径提供了可靠依据。通过大规模真实职业轨迹记录,学者能够深入探究教育背景与职业发展的关联机制,揭示技能迁移的内在规律,这对完善劳动力市场理论模型具有显著意义。
实际应用
在公共就业服务实践中,该数据集支持开发智能职业指导系统,帮助求职者识别潜在职业发展路径。企业人力资源部门可借助这些数据分析行业人才流动趋势,优化招聘策略。政府部门也能基于此制定更精准的就业政策,促进劳动力资源合理配置。
数据集最近研究
最新研究方向
在劳动力市场动态分析领域,JobHop数据集凭借其基于36万份匿名简历构建的大规模职业轨迹数据,正推动职业转型预测与技能匹配的前沿探索。当前研究聚焦于利用自然语言处理技术解析职业变迁模式,结合ESCO分类体系揭示跨行业人才流动规律。随着欧盟技能议程的推进,该数据集为政策制定者优化就业服务提供了实证基础,同时助力开发基于人工智能的职业规划工具,显著提升了劳动力市场分析的精准度与时效性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作