five

全国招投标数据商业挖掘分析数据模型|招投标数据集|商业挖掘数据集

收藏
贵州省数据知识产权登记平台2025-01-08 更新2025-01-09 收录
招投标
商业挖掘
下载链接:
https://gzdipp.gzsis.cn:12020/noticeDetail?id=308&type=1
下载链接
链接失效反馈
资源简介:
全国招投标数据商业挖掘分析数据模型由以下三类模型组合构成: 1、招标过程分类:利用TextCNN为base model,结合分词技术、招投标领域教据和应用场景生成垂直领域的数据分类模型; 2、命名实体识别:基于Bert的base模型,增加相对位置、词性等信息在招投标领域的数据上进行微调,并通过人工打标签的方式生成训练集并训练出实体抽取模型; 3、Ocr文字识别:通过人工标注图片数据,并进行paddle-0cr微调生成特定领域的OCR文字识别模型。 通过以上三类模型组合,可以识别多种招标文书,对文书内容进行识别,将多种结构的数据,构成结构化和半结构化组合的全国招投标数据大数据集合,支持网站、APP、小程序实时分析、访问和获取这些数据。
提供机构:
贵阳高新数通信息有限公司
创建时间:
2025-01-07
AI搜集汇总
数据集介绍
main_image_url
特点
该数据集是一个全国招投标数据的商业挖掘分析模型,数据规模为37G,每日更新。它通过三类模型组合(招标过程分类、命名实体识别和OCR文字识别)对招投标文书进行识别和分析,适用于企业采购需求分析、竞争对手评估和商机洞察等多种商业场景。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

烟火数据集

烟火数据集是一个专门用于烟火识别和检测任务的数据集,旨在帮助研究人员开发更加精确和高效的烟火识别算法。包含了大量真实场景下的烟火视频数据,具有广泛的应用前景和重要的研究价值。

阿里云天池 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

TCIA

TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。

www.cancerimagingarchive.net 收录