社会治理复杂系统关键要素及其间关系抽取测试数据
收藏国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=683dea33195d261233189824&type=1
下载链接
链接失效反馈官方服务:
资源简介:
社会治理复杂系统关键要素及其间关系抽取测试数据,是一个用于支撑社会治理复杂系统关键要素抽取方法研究的数据集,总容量为20MB,以表格形式储存。数据来自省级官方网络问政平台,包含了市民对热点事件的海量留言。通过合法授权的网络爬虫工具,按照既定规则与协议,从该问政平台网页爬取留言标题、留言内容、回复内容、留言类别、主题等内容所在的HTML元素位置,从而读取HTML元素的文本内容,最后保存到SQLite数据库中。留言数据涵盖了市政设施、施工管理、生活环境管理、食品安全等衣食住行多方面的话题,同时包括市场监管局、城市管理局、住建局、人社局等多个政府部门的回复。爬取数据后进行预处理和清洗。首先对爬取的文本数据进行过滤,删除答复缺失和文本过短的数据。其次对数据进行清洗与标注,本文使用开源数据标注平台Label Studio进行数据标注工作。处理后的数据能够为社会治理关键要素抽取,要素间关联与影响关系挖掘提供有力支撑。
提供机构:
北京理工大学
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个用于研究社会治理复杂系统关键要素抽取的测试数据,源自省级官方网络问政平台的市民留言,内容覆盖市政设施、施工管理、生活环境管理、食品安全等多个话题。数据经过预处理和清洗,以表格形式储存,容量为20MB,旨在支持要素抽取和关系挖掘研究。
以上内容由遇见数据集搜集并总结生成



