Quant Job Market Dataset
收藏github2026-05-04 更新2026-05-05 收录
下载链接:
https://github.com/kadoa-org/quant-job-market
下载链接
链接失效反馈官方服务:
资源简介:
包含50多家顶级量化金融公司的2,500多个量化相关职位发布,涵盖对冲基金、自营交易公司、做市商和资产管理公司。数据集包括职位分类(量化研究、量化交易、量化开发、HFT系统、ML/AI、数据科学、软件工程、风险、投资组合管理)、技术栈提取(编程语言等)、资历、教育要求(博士需求)、资产类别和位置等信息。
This dataset contains over 2,500 quant-related job postings from more than 50 leading quantitative finance firms, covering hedge funds, proprietary trading firms, market makers, and asset management companies. The dataset includes job classifications (quantitative research, quantitative trading, quantitative development, HFT systems, ML/AI, data science, software engineering, risk, portfolio management), extracted technology stacks (such as programming languages), seniority requirements, educational qualifications (including PhD requirements), asset classes, and location information.
创建时间:
2026-04-09
原始信息汇总
Quant Job Market 数据集详情
数据集概览
该数据集提供了50多家量化金融公司的2,500+条量化相关职位招聘信息,涵盖对冲基金、自营交易公司、做市商和资产管理公司。
数据内容
职位信息包含以下维度:
- 角色分类:量化研究、量化交易、量化开发、HFT系统、ML/AI、数据科学、软件工程、风险管理、投资组合管理
- 技术栈提取:编程语言等
- 资历级别
- 教育要求(如博士需求)
- 资产类别
- 工作地点
数据格式
数据集以两种格式提供:
| 文件名 | 描述 |
|---|---|
public/data/jobs.db |
SQLite数据库,包含所有已分类的职位信息 |
public/data/jobs.json |
所有分类职位招聘的JSON导出文件 |
数据来源
所有数据均从公司公开的职业页面抓取,使用 kadoa.com 获取数据并进行分类。
未来计划
- 历史追踪:职位发布速度、下架时间、季节性模式
- 扩大公司覆盖范围
- 薪资标准化(按生活成本调整、基本薪资 vs 总薪酬)
- 技能共现分析
许可证
数据集采用 MIT 许可证,职位数据来自公开的职业页面,仅供研究和教育用途。
搜集汇总
数据集介绍

构建方式
本数据集聚焦于量化金融领域的就业市场,通过系统性地爬取全球超过50家顶级对冲基金、自营交易公司、做市商及资产管理机构的官方招聘页面,构建了一个涵盖2500余个量化相关职位的结构化数据库。数据采集过程借助自动化工具提取职位描述中的关键信息,包括职位类别(如量化研究、量化交易、量化开发)、职级、编程语言需求、技能组合、资产类别、学历要求及工作模式等,并经过分类与清洗后存储为SQLite数据库及JSON格式文件,便于离线分析与使用。
特点
该数据集具有显著的全面性与实用价值,覆盖了量化金融领域的主要机构类型与角色分类,并提供了多维度的细粒度标签。其独特的交互式可视化界面支持按公司类型、职位、资历、地点、工作模式及资产类别进行动态筛选,同时内置洞察仪表盘,可直观展示技术栈分布、博士需求程度、热门编程语言、职位比例及地域特征等关键统计信息,为行业趋势分析与人才需求研究提供了可靠的数据支撑。
使用方法
数据集提供了两种便捷的本地使用途径:用户可直接加载JSON文件(jobs.json)通过Pandas、R等数据分析工具进行自定义处理,或利用内置的SQLite数据库(jobs.db)结合sql.js实现无后端的客户端查询。此外,项目还运行着一个互动式Web应用,通过简单的Bun命令(bun install && bun run dev)即可启动,从而在浏览器中探索热力图、职位表格及进阶洞察,且支持CSV导出功能,方便进一步的分析与分享。
背景与挑战
背景概述
量化金融领域作为金融与计算机科学深度融合的前沿阵地,其人才需求动态与技能演变轨迹一直是学界与业界关注的焦点。Quant Job Market数据集由Kadoa团队于2024年创建,旨在系统性地捕捉全球顶级量化金融企业的招聘信息。该数据集通过爬取50余家知名对冲基金、自营交易公司、做市商及资产管理机构的公开职业页面,收录了超过2500条量化相关岗位的详细信息,涵盖量化研究、量化交易、量化开发、高频交易系统、机器学习与人工智能、数据科学、软件工程、风险管理及投资组合管理等核心职能类别。数据集不仅标注了岗位的资历层级、教育背景要求(尤其是博士需求)、资产类别与工作模式,还深度提取了编程语言与技术栈等关键要素,为理解量化行业的人才结构、技能需求演变及区域分布格局提供了宝贵的结构化数据支撑。该数据集的出现,填补了该领域公开、结构化招聘数据的空白,对人力资源研究、金融科技教育及职业规划均有重要参考价值。
当前挑战
该数据集所面临的挑战主要体现在两个层面。其一,所解决的领域问题方面,量化金融行业招聘信息高度分散于各公司官网,格式多样、更新频繁,且岗位描述中常包含模糊或隐晦的专业术语(如特定策略、内部系统名称),传统方式难以系统化获取与分析。数据集的核心挑战在于如何从非结构化的海量文本中,精准且一致地提取出可比较的结构化字段,如技能标签、资历层级与技术栈分布,这要求爬虫与自然语言处理技术具备高度的领域适应性。其二,数据构建过程中,挑战尤为突出:不同公司的职业页面设计差异极大,爬虫需动态适应JavaScript渲染与反爬机制;岗位分类标准需兼顾行业通用性与各公司特殊性(如某些公司将“量化研究员”同时归为研究与交易岗);此外,数据时效性的维持极为棘手——岗位发布时间、移除时间及季节性波动(如校招季)的追踪需要长期、稳定的数据更新机制,而当前版本尚停留在静态快照层面,历史轨迹记录缺失,限制了趋势分析与生命周期研究的深入展开。
常用场景
经典使用场景
在量化金融研究领域,Quant Job Market Dataset 被广泛用于分析顶级对冲基金、自营交易公司和做市商的人才需求格局。研究者可通过该数据集对超过2500条岗位信息进行多维分类,如按角色(量化研究、量化交易、量化开发)、资历层级、编程语言技能栈及资产类别进行筛选与可视化,从而揭示行业招聘趋势与技能需求偏好。
解决学术问题
该数据集有效解决了量化金融领域劳动力市场透明度不足的学术难题。传统上,学者难以获取系统化、结构化的金融行业招聘数据,导致对人才流动、技能需求演化及教育背景要求(如博士学位需求)的研究受限。它提供了一个横跨50余家机构的标准化样本,支持实证分析,例如探究不同类机构对Python与C++的需求差异,或资历结构与地域分布的关联性,为劳动经济学与金融科技交叉研究奠定了数据基础。
衍生相关工作
基于该数据集,一系列衍生研究工作已逐步展开。其中涵盖跨机构的技能共现分析,以揭示量化领域内技术栈的协同演进规律;另有工作致力于岗位发布速度与季节性模式的动态追踪,为预测行业景气度提供指标。此外,通过整合薪资标准化与地理位置信息,研究者可开展生活成本调整后的薪酬对比研究,进一步深化对量化金融人才市场竞争格局的理解。
以上内容由遇见数据集搜集并总结生成



