five

中标公告信息查询

收藏
江苏数据交易所2025-04-14 更新2026-01-30 收录
下载链接:
https://exchange.jsdataex.com/trade-home/#/project/tradingMarket/productDetail?productId=10
下载链接
链接失效反馈
官方服务:
资源简介:
招投标信息要素采集系统是一个基于webmagic框架的关键要素信息采集的系统,采用了较为智能精准的页面解析规则技术,能从互联网采集公开的招标信息。核心技术包括:基于springboot搭建的爬虫管理系统,同时包含mongo、oracle、activeMq和redis,项目基于maven进行开发;系统使用多线程触发爬虫的并发启动;采用比较成熟的解析规则进行解析如:jsoup、xpath、正则等;通过redis队列对待爬取链接进行管理。采集的数据源不涉及需要账户登陆或其他身份验证手段的站点。
提供机构:
广州比地数据科技有限公司
创建时间:
2025-04-14
搜集汇总
背景与挑战
背景概述
该数据集聚焦于招投标领域,提供了一个基于webmagic框架的智能信息采集系统,能够从公开互联网站点自动抓取中标公告等招标信息。系统采用多线程并发技术和成熟的解析规则(如jsoup、xpath),确保高效、精准的数据采集,且数据源均为无需账户登录的公开站点,增强了数据的可访问性和实用性。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务