five

azraksahin/resumes

收藏
Hugging Face2026-04-28 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/azraksahin/resumes
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个合并了真实简历和合成简历的集合,以JSON格式存储,用于技术招聘领域的NLP模型开发。数据集包含个人信息、工作经验、教育背景、技能和项目等关键部分。真实简历来自各种CV提交,经过归一化处理;合成简历使用Faker库生成,模拟真实简历结构和内容。数据集旨在为简历解析和候选人-职位匹配提供丰富多样的示例。

This dataset is a combined collection of real resumes and synthetically generated CVs. The resumes have been normalized to a common schema to facilitate the development of NLP models for candidate-job matching in the technical recruitment domain. Real resumes are collected and normalized from various CV submissions, while synthetic resumes are generated using custom Python scripts leveraging Faker, with role-specific constraints. The dataset provides a rich, diverse set of examples crucial for training robust NLP models for resume parsing and candidate-job matching.
提供机构:
azraksahin
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作