Saba06huggingface/resume_dataset
收藏Hugging Face2024-02-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Saba06huggingface/resume_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是从livecareer.com收集的简历示例,用于将给定简历分类到数据集中定义的任何标签。数据集包含2400多个简历,以字符串和PDF格式存储。PDF文件根据其标签分类存储在数据文件夹中,每个简历以PDF形式存储在其对应的文件夹中,文件名为CSV中定义的ID。CSV文件包含ID、Resume_str(简历文本字符串)、Resume_html(网页抓取时的HTML格式简历数据)和Category(简历用于申请的职位类别)。
该数据集是从livecareer.com收集的简历示例,用于将给定简历分类到数据集中定义的任何标签。数据集包含2400多个简历,以字符串和PDF格式存储。PDF文件根据其标签分类存储在数据文件夹中,每个简历以PDF形式存储在其对应的文件夹中,文件名为CSV中定义的ID。CSV文件包含ID、Resume_str(简历文本字符串)、Resume_html(网页抓取时的HTML格式简历数据)和Category(简历用于申请的职位类别)。
提供机构:
Saba06huggingface
原始信息汇总
数据集卡片 Saba06huggingface/resume_dataset
数据集描述
背景
该数据集是从livecareer.com收集的简历示例集合,用于将给定简历分类到数据集中定义的任何标签中。
内容
- 包含2400+份简历,格式为字符串和PDF。
- PDF文件存储在数据文件夹中,按各自的标签分类为文件夹,每个简历以PDF形式存储在文件夹中,文件名作为CSV中定义的ID。
CSV文件内容
- ID: 唯一标识符和相应PDF文件的文件名。
- Resume_str: 仅包含简历文本的字符串格式。
- Resume_html: 包含网页抓取时简历数据的HTML格式。
- Category: 简历申请的工作类别。
类别
- HR, Designer, Information-Technology, Teacher, Advocate, Business-Development, Healthcare,
- Fitness, Agriculture, BPO, Sales, Consultant, Digital-Media, Automobile, Chef, Finance, Apparel,
- Engineering, Accountant, Construction, Public-Relations, Banking, Arts, Aviation



