lang-uk/recruitment-dataset-candidate-profiles-ukrainian
收藏Hugging Face2024-06-02 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/lang-uk/recruitment-dataset-candidate-profiles-ukrainian
下载链接
链接失效反馈官方服务:
资源简介:
Djinni数据集(乌克兰简历部分)包含2020年至2023年间在Djinni IT招聘平台上发布的15万条职位描述和23万份匿名候选人简历,涵盖英语和乌克兰语样本。数据集包含多个与候选人简历相关的属性,如职位名称、候选人信息、候选人亮点、求职偏好、职位类型、英语水平、经验年限、简历文本、简历语言和唯一标识符。数据集旨在支持多种应用,包括推荐系统、语义搜索、大型语言模型的训练、AI辅助招聘的公平性、招聘自动化、市场分析、趋势分析和战略规划。
提供机构:
lang-uk
原始信息汇总
Djinni Dataset (Ukrainian CVs part)
概述
Djinni Recruitment Dataset(乌克兰简历部分)包含150,000个职位描述和230,000份匿名候选人简历,这些简历于2020-2023年间在Djinni IT职位平台上发布。数据集包括英语和乌克兰语样本。
数据集包含与候选人简历相关的各种属性,包括职位名称、候选人信息、候选人亮点、求职偏好、职位类型、英语水平、工作经验年数、合并的简历文本、简历语言和唯一标识符。
预期用途
Djinni数据集旨在支持多种应用:
-
推荐系统和语义搜索: 它作为增强职位推荐引擎和语义搜索功能的关键资源,使求职过程更加直观和符合个人偏好。
-
大型语言模型(LLMs)的进步: 数据集为英语和乌克兰语领域特定的LLMs提供了宝贵的训练数据。它在提高模型在特定招聘环境中的理解和生成能力方面起着重要作用。
-
AI辅助招聘的公平性: 通过作为AI公平性的基准,Djinni数据集有助于减少AI辅助招聘过程中的偏见,促进更公平的招聘实践。
-
招聘自动化: 数据集支持简历和职位描述自动化创建工具的开发,简化招聘流程。
-
市场分析: 它提供了对乌克兰科技行业动态的洞察,包括冲突的影响,有助于全面的市场分析。
-
趋势分析和主题发现: 数据集支持对科技行业内趋势分析和主题发现的建模和分类。
-
战略规划: 通过实现公司领域的自动识别,数据集有助于战略市场规划。
数据集信息
- 语言: 乌克兰语
- 许可证: MIT
- 大小类别: 10K<n<100K
- 特征:
Position:字符串Moreinfo:字符串Looking For:字符串Highlights:字符串Primary Keyword:字符串English Level:字符串Experience Years:浮点数CV:字符串CV_lang:字符串id:字符串__index_level_0__:整数
- 分割:
train:61582148字节,24230个样本
- 下载大小: 32043828字节
- 数据集大小: 61582148字节
- 配置:
default:train:数据/train-*



