Divyaamith/Kaggle-Resume
收藏Hugging Face2024-03-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Divyaamith/Kaggle-Resume
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含来自livecareer.com的简历示例,用于将给定简历分类到数据集中定义的任何标签。数据集包含2400多个简历,以字符串和PDF格式存储。PDF文件根据各自的标签分类为文件夹,每个简历以PDF形式存储在其对应的文件夹中,文件名为CSV中定义的ID。CSV文件包含ID(唯一标识符和PDF文件名)、Resume_str(仅包含简历文本的字符串格式)、Resume_html(包含网页抓取时的HTML格式简历数据)和Category(简历用于申请的职位类别)。
该数据集包含来自livecareer.com的简历示例,用于将给定简历分类到数据集中定义的任何标签。数据集包含2400多个简历,以字符串和PDF格式存储。PDF文件根据各自的标签分类为文件夹,每个简历以PDF形式存储在其对应的文件夹中,文件名为CSV中定义的ID。CSV文件包含ID(唯一标识符和PDF文件名)、Resume_str(仅包含简历文本的字符串格式)、Resume_html(包含网页抓取时的HTML格式简历数据)和Category(简历用于申请的职位类别)。
提供机构:
Divyaamith
原始信息汇总
数据集概述
背景
数据集包含从livecareer.com收集的简历示例,用于将给定简历分类到数据集中定义的标签之一。
内容
- 包含2400+份简历,格式包括字符串和PDF。
- PDF文件存储在data文件夹中,按各自标签分类为文件夹,每个简历以PDF形式存储在相应文件夹中,文件名即为CSV中定义的ID。
CSV文件内容
- ID: 唯一标识符,也是相应PDF文件的文件名。
- Resume_str: 仅包含简历文本的字符串格式。
- Resume_html: 包含网页抓取时简历数据的HTML格式。
- Category: 简历申请的工作类别。
类别
- HR
- Designer
- Information-Technology
- Teacher
- Advocate
- Business-Development
- Healthcare
- Fitness
- Agriculture
- BPO
- Sales
- Consultant
- Digital-Media
- Automobile
- Chef
- Finance
- Apparel
- Engineering
- Accountant
- Construction
- Public-Relations
- Banking
- Arts
- Aviation
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个包含2400多份简历的集合,涵盖24种职业类别,每份简历同时提供文本和HTML格式。数据来源于livecareer.com,主要用于简历分类任务。
以上内容由遇见数据集搜集并总结生成



