公共财政绩效评价指标 信息数据
收藏浙江省数据知识产权登记平台2025-03-14 更新2025-03-15 收录
下载链接:
https://www.zjip.org.cn/home/announce/trends/117493
下载链接
链接失效反馈官方服务:
资源简介:
本数据集的核心价值在于将公共财政绩效评价项目中的评价指标文本信息进行了提取、特征化、识别、标准化、格式化等处理,从而提高了数据的可用性和分析效率。具体应用场景包括但不限于:(1)AI模型的开发与训练:本数据集可以作为指标体系生成、绩效趋势预测等AI模型开发和训练的高质量的基础数据,从而提高AI模型的训练效率和准确性。(2)公共财政绩效指标体系构建:由于本数据集涵盖的评价指标信息的全面性,可为政府部门构建和完善预算绩效指标体系提供有效的借鉴和参考。1.数据采集:从公司的公共财政绩效评价历史项目库的报告中,采集与项目基本信息和评价指标相关的内容,格式包括doc、docx、pdf和图像。记录被采集报告的项目名称和采集的时间。
2.文本提取:使用Apache POI库对doc、docx格式进行解析,使用PDFMiner工具对pdf格式进行解析,提取其中的文本内容。使用tesseract OCR光学字符识别工具将图像中的文本转换为机器可读的文本格式。
3.数据预处理:1)去除提取出的文本中与项目基本信息和评价指标无关的字符。2)对文本内容进行分词处理,以便于提取关键词和短语。3)删除常见的、意义不大的词汇。
4.特征提取:使用TF-IDF(词频-逆文档频率)算法提取文本中的关键词。
5.指标识别:使用自然语言处理(NLP)对评价指标进行分类识别。
6.人工检查:通过公司专业人员对NLP识别的评价指标进行审核,确保识别结果的准确性和可靠性。
7.数据标准化:将识别出的评价指标按照统一的格式进行归一化处理,如对评价指标的单位进行统一等。将提取的评价指标信息格式化为统一的csv数据结构。记录数据完成处理的时间,并赋予唯一编号。
提供机构:
浙江闰政管理咨询有限责任公司
创建时间:
2024-12-23
搜集汇总
数据集介绍

特点
该数据集为公共财政绩效评价指标信息数据,包含550条CSV格式记录,涵盖项目基本信息、评价指标文本信息等,适用于AI模型开发和公共财政绩效指标体系构建。数据由浙江闰政管理咨询有限责任公司自行产生,并按需更新。
以上内容由遇见数据集搜集并总结生成



