five

Saba06huggingface/resume_dataset

收藏
Hugging Face2024-02-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Saba06huggingface/resume_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是从livecareer.com收集的简历示例,用于将给定简历分类到数据集中定义的任何标签。数据集包含2400多个简历,以字符串和PDF格式存储。PDF文件根据其标签分类存储在数据文件夹中,每个简历以PDF形式存储在其对应的文件夹中,文件名为CSV中定义的ID。CSV文件包含ID、Resume_str(简历文本字符串)、Resume_html(网页抓取时的HTML格式简历数据)和Category(简历用于申请的职位类别)。

该数据集是从livecareer.com收集的简历示例,用于将给定简历分类到数据集中定义的任何标签。数据集包含2400多个简历,以字符串和PDF格式存储。PDF文件根据其标签分类存储在数据文件夹中,每个简历以PDF形式存储在其对应的文件夹中,文件名为CSV中定义的ID。CSV文件包含ID、Resume_str(简历文本字符串)、Resume_html(网页抓取时的HTML格式简历数据)和Category(简历用于申请的职位类别)。
提供机构:
Saba06huggingface
原始信息汇总

数据集卡片 Saba06huggingface/resume_dataset

数据集描述

背景

该数据集是从livecareer.com收集的简历示例集合,用于将给定简历分类到数据集中定义的任何标签中。

内容

  • 包含2400+份简历,格式为字符串和PDF。
  • PDF文件存储在数据文件夹中,按各自的标签分类为文件夹,每个简历以PDF形式存储在文件夹中,文件名作为CSV中定义的ID。

CSV文件内容

  • ID: 唯一标识符和相应PDF文件的文件名。
  • Resume_str: 仅包含简历文本的字符串格式。
  • Resume_html: 包含网页抓取时简历数据的HTML格式。
  • Category: 简历申请的工作类别。

类别

  • HR, Designer, Information-Technology, Teacher, Advocate, Business-Development, Healthcare,
  • Fitness, Agriculture, BPO, Sales, Consultant, Digital-Media, Automobile, Chef, Finance, Apparel,
  • Engineering, Accountant, Construction, Public-Relations, Banking, Arts, Aviation
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作