five

立法规划计划建议及法治调研报告生成系统数据集

收藏
国家基础学科公共科学数据中心2025-11-01 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=69023a0d195d2632a803c480&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集专门为立法规划建议、计划建议及法治调研报告的智能辅助生成系统构建,旨在支持立法主题分析模型和文本生成模型的性能评估研究。 数据集聚焦于要素覆盖率和要素关联准确率两个核心评估指标,为模型的全面测试提供高质量的基准数据。数据集构建采用大语言模型DeepSeek-R1生成合成法治文件,严格按照标准化生成规范执行。每篇报告必须完整包含六大核心要素:紧迫性、可行性、必要性、立项论证、制度现状、相关政策支撑,确保测试数据的要素完整性和评估有效性。生成过程中要求采用标准学术报告格式,包含概述/引言、正文分章节、结论等完整结构,正文使用层级标题组织,字数严格控制在2048-4096字区间,保证内容的专业性和规范性。数据集在类型和领域分布上保持均衡覆盖,包括法治意见文件、法治调研报告、涉外风险报告三种报告类型,涵盖生态保护、营商环境、基层社会治理三个重要领域。所有文件均经过严格的人工筛选和预处理,包括去重与清洗、要素标注、权重因子分类等质量控制步骤,确保数据的准确性和可靠性。最终构建的测试数据集包含100条高质量法治文件记录,每条记录不仅包含完整的报告正文内容,还标注了具体的要素类别信息,支持要素覆盖率测试、要素关联准确率测试等多项评估任务,为文本生成模型的性能评估提供了可靠的测试基准。数据集还包括了系统设计方案、测试大纲、测试报告。
提供机构:
北京大学
二维码
社区交流群
二维码
科研交流群
商业服务