five

0xnbk/resume-domain-triplets-train-v1-en

收藏
Hugging Face2025-10-14 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/0xnbk/resume-domain-triplets-train-v1-en
下载链接
链接失效反馈
官方服务:
资源简介:
Resume-Domain Triplets Dataset v1 (English)是一个用于训练领域分类模型的对比学习数据集,它使用三元组损失来理解工作描述之间的专业领域对齐。数据集包含40K三元组(32K训练,8K验证),涵盖了13个专业领域,并且所有领域都有平衡的表示。每个三元组包含一个锚点工作描述、一个来自同一领域的积极工作描述和一个来自不同领域的消极工作描述。数据集由LinkedIn的真实职位发布中挖掘的高质量三元组组成。数据集的设计目的是用于领域分类模型训练、对比学习、ATS领域匹配和跨领域转移研究。

The Resume-Domain Triplets Dataset v1 (English) is a contrastive learning dataset designed for training domain classification models using triplet loss. It includes 40K triplets (32K training, 8K validation) across 13 professional domains with balanced representation. Each triplet consists of an anchor job description, a positive job description from the same domain, and a negative job description from a different domain. The dataset is composed of high-quality triplets mined from real LinkedIn job postings. It is intended for domain classification model training, contrastive learning, ATS domain matching, and cross-domain transfer studies.
提供机构:
0xnbk
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作