five

Divyaamith/Kaggle-Resume

收藏
Hugging Face2024-03-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Divyaamith/Kaggle-Resume
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含来自livecareer.com的简历示例,用于将给定简历分类到数据集中定义的任何标签。数据集包含2400多个简历,以字符串和PDF格式存储。PDF文件根据各自的标签分类为文件夹,每个简历以PDF形式存储在其对应的文件夹中,文件名为CSV中定义的ID。CSV文件包含ID(唯一标识符和PDF文件名)、Resume_str(仅包含简历文本的字符串格式)、Resume_html(包含网页抓取时的HTML格式简历数据)和Category(简历用于申请的职位类别)。

该数据集包含来自livecareer.com的简历示例,用于将给定简历分类到数据集中定义的任何标签。数据集包含2400多个简历,以字符串和PDF格式存储。PDF文件根据各自的标签分类为文件夹,每个简历以PDF形式存储在其对应的文件夹中,文件名为CSV中定义的ID。CSV文件包含ID(唯一标识符和PDF文件名)、Resume_str(仅包含简历文本的字符串格式)、Resume_html(包含网页抓取时的HTML格式简历数据)和Category(简历用于申请的职位类别)。
提供机构:
Divyaamith
原始信息汇总

数据集概述

背景

数据集包含从livecareer.com收集的简历示例,用于将给定简历分类到数据集中定义的标签之一。

内容

  • 包含2400+份简历,格式包括字符串和PDF。
  • PDF文件存储在data文件夹中,按各自标签分类为文件夹,每个简历以PDF形式存储在相应文件夹中,文件名即为CSV中定义的ID。

CSV文件内容

  • ID: 唯一标识符,也是相应PDF文件的文件名。
  • Resume_str: 仅包含简历文本的字符串格式。
  • Resume_html: 包含网页抓取时简历数据的HTML格式。
  • Category: 简历申请的工作类别。

类别

  • HR
  • Designer
  • Information-Technology
  • Teacher
  • Advocate
  • Business-Development
  • Healthcare
  • Fitness
  • Agriculture
  • BPO
  • Sales
  • Consultant
  • Digital-Media
  • Automobile
  • Chef
  • Finance
  • Apparel
  • Engineering
  • Accountant
  • Construction
  • Public-Relations
  • Banking
  • Arts
  • Aviation
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个包含2400多份简历的集合,涵盖24种职业类别,每份简历同时提供文本和HTML格式。数据来源于livecareer.com,主要用于简历分类任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作