CareerNet
收藏github2026-03-06 更新2026-03-06 收录
下载链接:
https://github.com/RenaissancePhilanthropy/careernet-data
下载链接
链接失效反馈官方服务:
资源简介:
CareerNet是一个由Renaissance Philanthropy主导的项目,旨在开发三个最先进的基准数据集,利用CareerVillage.org平台众包职业建议。该项目从超过60,000个问题和350万学习者中筛选数据,旨在增强AI在指导用户职业导航和获取社会福利方面的能力。数据集涵盖了职业导航问题以及来自三个领域(通用/再培训、技术和医疗保健)的众包专业答案数据,并注释了三个质量尺度(正确性、完整性和连贯性)、目标识别(提问者的目标)和场景(提问的职业方面)。
CareerNet is a project led by Renaissance Philanthropy that aims to develop three state-of-the-art benchmark datasets by crowdsourcing career advice via the CareerVillage.org platform. The project curates data from over 60,000 questions and 3.5 million learners, with the objective of enhancing AI's capabilities in guiding users' career navigation and helping them access social welfare. The datasets encompass career navigation questions and crowdsourced professional answer data across three domains: general/reskilling, technology, and healthcare. Furthermore, they are annotated with three quality metrics (correctness, completeness, and coherence), the intended goals of questioners, and the career-related scenarios of each submitted query.
创建时间:
2026-02-20
原始信息汇总
CareerNet 数据集概述
数据集简介
CareerNet 是由 Renaissance Philanthropy 主导的一个项目,旨在开发三个先进的基准数据集。该项目利用了 CareerVillage.org 平台(一个众包职业建议的平台)的数据,旨在提升人工智能在指导用户规划职业和获取社会福利方面的能力。
数据来源与规模
- 数据来源平台:CareerVillage.org
- 原始数据规模:从超过 60,000 个问题和超过 350 万学习者中选取数据。
数据集构成与目标
- 开发合作伙伴:The Learning Agency
- 数据集目标:为人工智能模型开发提供标注数据集,旨在支持低收入个体的职业轨迹和向上流动,特别关注技能重塑、技术职业和联合健康职业。
- 数据内容:包含来自三个领域(通用/技能重塑、技术、医疗保健)的职业导航问题及众包专业回答数据。
数据标注维度
数据在以下维度进行了标注:
- 质量尺度:正确性、完整性、连贯性。
- 目标识别:提问者的目标。
- 场景:所询问的职业方面。
详细资料与文档
- 数据详情文档:有关数据、抽样和标注的详细信息,请参阅 Data Details PDF。
- 数据字典:每个领域的代码簿包含变量、变量类型、变量描述、缺失数量、值及值频率。
联系方式
有关数据的疑问,请联系:ulrich@renphil.org
搜集汇总
数据集介绍
构建方式
在职业发展领域,CareerNet数据集依托CareerVillage.org平台,从超过6万个问题及350万学习者的海量数据中精心筛选而成。项目团队与The Learning Agency合作,针对职业导航问题及众包专业回答,聚焦于通用/再培训、技术和医疗保健三大领域。数据标注过程涵盖了三个质量维度——正确性、完整性与连贯性,同时识别提问者的目标及所涉及的具体职业场景,确保了数据结构的科学性与实用性。
使用方法
研究人员与开发者可通过GitHub仓库获取数据集及相关文档,包括详细的数据说明PDF与各领域的代码手册。代码手册中列出了变量类型、描述、缺失值统计及频率分布,为数据探索与预处理提供了清晰指引。该数据集适用于训练与评估自然语言处理模型,特别是在职业咨询、目标识别与回答质量评估等任务中,能够帮助构建更精准、人性化的职业辅助系统,推动AI在职业发展领域的实际应用。
背景与挑战
背景概述
在人工智能与职业发展交叉领域,CareerNet数据集作为一项由文艺复兴慈善基金会主导的创新项目,于近年应运而生。该项目依托CareerVillage.org平台,汇集了超过6万个职业导航问题及350万学习者的众包专业建议,旨在构建三个前沿基准数据集。核心研究聚焦于提升AI模型在职业指导与社会福利获取方面的能力,特别关注低收入群体的技能重塑、技术岗位及医疗辅助职业发展。通过与The Learning Agency合作,该数据集不仅推动了AI在职业轨迹优化领域的应用,也为促进社会流动性提供了数据驱动的解决方案。
当前挑战
CareerNet数据集面临的挑战主要体现在领域问题与构建过程两方面。在领域层面,职业导航涉及多维度复杂决策,需精准识别提问者目标并评估回答的正确性、完整性与连贯性,这对AI模型的语义理解与情境推理能力提出了极高要求。构建过程中,从海量众包数据中筛选高质量样本并进行精细化标注,包括目标识别与场景分类,需要克服数据噪声大、标注标准统一性难保障等难题。此外,确保数据在技能重塑、技术与医疗等特定领域的代表性与公平性,也是数据集构建中的关键挑战。
常用场景
经典使用场景
在职业发展与人机交互研究领域,CareerNet数据集为自然语言处理模型提供了丰富的基准测试资源。其经典使用场景集中于训练和评估AI系统,以生成或评估针对职业导航问题的专业回答。研究者利用该数据集中的标注信息,如回答的正确性、完整性和连贯性,来优化模型在理解复杂职业咨询语境下的表现,从而推动智能职业辅导工具的开发。
解决学术问题
该数据集有效解决了人工智能在职业咨询领域面临的若干关键学术问题,包括如何准确识别用户提问中的隐含目标,以及如何评估生成回答的质量与实用性。通过提供大规模、多领域(通用/再技能、技术、医疗)的标注数据,CareerNet支持了对话系统、信息检索和文本生成等研究方向,促进了AI在理解社会流动性需求方面的理论进展,为低收入群体的职业轨迹研究提供了数据基础。
实际应用
在实际应用中,CareerNet数据集被广泛用于开发智能职业导航平台和在线咨询系统。这些系统能够为求职者,特别是专注于再技能培训、技术岗位和医疗辅助职业的低收入个体,提供个性化、高质量的职业生涯建议。通过整合标注的目标识别和场景分类,此类工具帮助用户更高效地获取社会资源,提升职业向上流动性,体现了人工智能技术在社会公益领域的实践价值。
数据集最近研究
最新研究方向
在职业发展与社会公益交叉领域,CareerNet数据集正推动人工智能向更具包容性的职业导航系统演进。该数据集聚焦于低收入群体的职业轨迹与向上流动,通过标注职业导航问题与专业回答的质量维度,如正确性、完整性和连贯性,为AI模型在再培训、技术和医疗保健等关键领域的应用提供了基准。前沿研究致力于利用这些标注数据,开发能够精准识别用户职业目标与场景的算法,以增强AI在促进社会公平与经济效益方面的潜力,呼应了全球范围内对技能重塑与职业转型的迫切需求。
以上内容由遇见数据集搜集并总结生成



