five

boss_直聘岗位信息爬取

收藏
魔搭社区2026-05-22 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/mungeryang/boss_zhipin
下载链接
链接失效反馈
官方服务:
资源简介:
任务:使用Scrapy框架采集boss直聘网站互联网/AI领域全站岗位信息。项目难点:分页爬取、selenium动态页面加载、parse函数请求传参、mysql数据库存储。技术栈:Scrapy、selenium、Http协议、Xpath数据解析。开源链接:https://github.com/Mungeryang/boss_data

Task: Scrape full-site job posting data in the Internet and AI sectors from the Zhipin Boss website using the Scrapy framework. Project challenges: Pagination crawling, dynamic page loading via Selenium, request parameter passing in the parse function, and MySQL database storage. Technology stack: Scrapy, Selenium, HTTP protocol, and XPath data parsing. Open-source repository link: https://github.com/Mungeryang/boss_data
提供机构:
maas
创建时间:
2024-08-09
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是通过scrapy爬取的boss直聘网站互联网领域内的岗位描述信息,以.csv格式保存,适用于文本分类、特征抽取等自然语言处理训练任务。数据集聚焦于互联网行业的招聘数据,为相关NLP研究提供了结构化文本资源。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务