five

JobVision_Jobposts_Dataset

收藏
Hugging Face2025-08-01 更新2025-08-02 收录
下载链接:
https://huggingface.co/datasets/JobVision/JobVision_Jobposts_Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
JobVision_Jobposts_Dataset是一个包含伊朗最大在线招聘网站JobVision的匿名化招聘广告的数据集。它提供了关于伊朗劳动力市场的粒度洞察,包括职位要求、薪资范围、技能需求等详细信息。该数据集适用于人力资源分析和劳动力经济学研究。
创建时间:
2025-08-01
原始信息汇总

💼 JobVision JobPosts Dataset 概述

📌 基本信息

  • 数据集名称: JobVision_Jobposts_Dataset
  • 来源: JobVision
  • 数据量: ~365k 行
  • 发布日期: August 2025
  • 语言: 波斯语(主要),关键字段提供英语翻译
  • 格式: CSV(表格形式)
  • 领域: 招聘、人力资源、劳动力市场分析
  • 时间范围: 2022–2024

📋 数据集概述

该数据集包含来自伊朗最大在线招聘平台JobVision的匿名招聘广告,提供伊朗劳动力市场的详细洞察,包括职位要求、薪资范围和技能需求。适用于人力资源分析和劳动经济学研究。

📊 数据结构

🏷️ 职位元数据

  • Jobpost_RawTitle: 职位标题(如"برنامه نویس full-stack")
  • Jobpost_PreferredGender: 性别偏好(如"ترجیحاً آقا")
  • Jobpost_ProvinceFa/Jobpost_ProvinceEn: 工作地点(如"Tehran")
  • Jobpost_WorkTypeEn/Jobpost_WorkTypeFa: 雇佣类型(全职、兼职)
  • Jobpost_SalaryCanBeShown: 薪资是否公开(True/False)
  • Jobpost_MinSalary/Jobpost_MaxSalary: 薪资范围(伊朗里亚尔)
  • Jobpost_RequiredExperienceYears: 所需工作经验年限
  • 其他特征: Jobpost_RequiredRelatedExperienceInThisIndustry, Jobpost_CompanyWorkTimesDescription, Jobpost_ActivationTime_YEAR_MONTH

📝 分类

  • Jobpost_MainJobCategory: 主要职位类别(如"مالی و حسابداری")
  • Jobpost_SecondaryJobCategories: 次要职位类别

🛠️ 技能与资格

  • Jobpost_SoftwareSkills: 软件技能(JSON格式,如[{"TitleFa":"پایتون","TitleEn":"Python","Level":"پیشرفته"}])
  • Jobpost_LanguageSkills: 语言能力(如[{"Languages_TitleFa":"انگلیسی","Languages_TitleEn":"English","Level":"متوسط ۵۰٪"}])

🏢 公司详情

  • Company_ProvinceEn/Company_CityEn: 公司地点(如"Tehran")
  • Company_SizeEn/Company_SizeFa: 员工人数(如"11-50 employees")
  • Company_IndustryEn: 行业(如"IT / Software / Hardware")
  • 其他特征: Company_AgeFromEstablishmentYear, Company_CompanyOwnershipTypesEn, Company_ActivityType

🌐 福利与政策

  • Jobpost_BenefitEn/Jobpost_BenefitFa: 福利(如"Health insurance, Commision")
  • Jobpost_IsRemote: 是否支持远程工作(True/False)
  • Jobpost_HasDisabilitySupport: 是否提供残疾支持(True/False)
  • Jobpost_RequiredMinAge/Jobpost_RequiredMaxAge: 年龄要求
  • Jobpost_RequiredMilitaryServiceCard: 是否需要兵役证(True/False)

💡 应用场景

  1. 薪资预测: 根据职位特征预测预期薪资。
  2. 劳动力市场分析:
    • 识别地区技能缺口(如伊斯法罕的React开发者)。
    • 跟踪行业/经验的薪资趋势。
  3. 地理空间可视化: 按地区映射职位密度和薪资差异。
  4. 公司招聘策略:
    • 基准福利(如43%的技术职位提供远程工作)。
    • 分析性别特定角色(Jobpost_PreferredGender)。
  5. 需求预测: 跟踪跨行业和省份的招聘趋势。

🤝 贡献

欢迎通过info@jobvision.ir联系以改进数据集。

搜集汇总
数据集介绍
main_image_url
构建方式
JobVision_Jobposts_Dataset数据集构建基于伊朗最大在线招聘平台JobVision的匿名化职位广告数据,采用系统化爬取与清洗流程,确保数据质量与合规性。原始数据经过脱敏处理,移除个人身份信息,保留结构化字段如职位名称、薪资范围、技能要求等关键维度。数据覆盖2022至2024年期间,通过自动化脚本按月增量更新,辅以人工校验机制处理多语言字段(波斯语与英语)的标准化映射,最终形成包含36.5万条记录的CSV格式表格。
特点
该数据集以波斯语为主体的多语言架构凸显地域特色,同时关键字段提供英语翻译,支持跨文化研究。其核心价值在于细粒度的劳动力市场指标,包括薪资区间、工作经验要求、软件技能等级等量化字段,以及远程工作支持、残疾保障等政策标签。独特的嵌套JSON结构(如技能列表)实现了复杂能力的多维表征,而省份级地理编码和行业分类体系为空间分析与垂直领域研究提供了基础框架。
使用方法
使用本数据集时,建议优先利用Jobpost_ActivationTime_YEAR_MONTH字段进行时间序列分析,结合薪资与经验字段构建回归模型。处理多语言技能数据需解析JSON结构,注意波斯语字符编码问题。地理分析可关联Jobpost_ProvinceEn与Company_ProvinceEn字段,而行业对比建议采用Jobpost_MainJobCategory分类。典型应用场景包括:通过Jobpost_SoftwareSkills字段追踪技术栈需求演变,或基于Jobpost_IsRemote和Jobpost_BenefitEn字段研究企业福利政策与人才吸引力的关联性。
背景与挑战
背景概述
JobVision_Jobposts_Dataset作为伊朗最大的在线招聘平台JobVision发布的劳动力市场数据集,于2025年8月正式公开,收录了2022至2024年间约36.5万条波斯语为主的招聘广告。该数据集由JobVision数据科学团队构建,聚焦于中东地区独特的劳动力市场特征,通过详尽的职位描述、薪资区间、技能需求等结构化字段,为人力资源分析和劳动经济学研究提供了珍贵的一手资料。其多语言字段设计和行业分类体系,显著提升了波斯语地区劳动力市场研究的可及性与精确度,填补了中东地区高质量就业数据集的空白。
当前挑战
该数据集面临的挑战主要体现在两个方面:在领域问题层面,波斯语自然语言处理技术的局限性使得非结构化文本的语义解析面临困难,特别是处理波斯语特有的右向书写和复杂形态学特征时;跨文化就业偏好(如性别倾向、兵役要求等)的量化分析也缺乏成熟方法论。在构建过程中,数据匿名化与信息保留的平衡、多语言字段的精准对齐、以及伊朗特有的货币单位和薪资表述标准化等问题,都对数据质量控制提出了较高要求。
常用场景
经典使用场景
在人力资源分析与劳动经济学研究中,JobVision_Jobposts_Dataset作为伊朗最大的在线招聘平台数据集,为研究者提供了深入探索劳动力市场的机会。该数据集通过详尽的职位广告信息,包括薪资范围、技能需求和工作类型等,成为分析区域技能差异、预测薪资趋势以及研究就业市场动态的经典工具。尤其在跨行业比较和性别角色分析方面,数据集展现了其独特的学术价值。
衍生相关工作
围绕该数据集,已衍生出多项经典研究,包括基于机器学习的薪资预测模型、劳动力市场的时空可视化分析以及跨行业技能需求的动态追踪。这些研究不仅丰富了劳动经济学的理论框架,还为实际应用提供了可操作的工具和方法,进一步推动了数据驱动的决策支持系统的发展。
数据集最近研究
最新研究方向
随着全球劳动力市场的数字化转型加速,JobVision_Jobposts_Dataset为研究伊朗劳动力市场提供了独特视角。近期研究聚焦于利用该数据集分析技能需求与薪资结构的动态关联,特别是在信息技术和金融行业。人工智能驱动的职位推荐系统成为热点,研究者通过分析Jobpost_SoftwareSkills和Jobpost_LanguageSkills字段,构建了跨语言技能匹配模型。地缘经济因素促使学者关注区域就业差异,结合Jobpost_ProvinceFa和Company_IndustryEn字段的空间分析揭示了德黑兰与其他省份的产业结构鸿沟。远程工作趋势研究通过Jobpost_IsRemote字段的时序分析,展现了后疫情时代工作模式的演变。该数据集在揭示隐性就业歧视方面具有突破性价值,特别是Jobpost_PreferredGender和Jobpost_RequiredMilitaryServiceCard等字段为平等就业政策研究提供了实证基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作