多模态服务智能监管规则表达语言及转化工具训练评估数据集
收藏国家基础学科公共科学数据中心2025-12-20 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=69442514195d2666dedf072d&type=1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集面向多模态服务监管规则形式化建模与转化工具开发需求构建,旨在解决当前服务监管领域规则形式化不足、多模态数据融合困难等问题。数据集于 2023-2024 年间在由浙江大学、浙江大学滨江研究院联合构建,依托实验室多模态数据处理平台与 GPU 计算资源,通过 “真实规则采集 + 准规则生成 + 语义增强 + 人工标注” 四阶段方案产生。真实规则源自食品安全、环境监管等 10 个典型领域的权威文件,准规则通过 GPT-4 生成并经专家审校,再经语义增强扩展与 HORAE 形式化标注,经数据清洗、格式统一等处理后,按 8:1:1 划分训练集、验证集与测试集,保障数据质量。数据集含 9.67MB 数据,涵盖 pdf、py、json 等多种格式,核心包括团体标准草案、1 篇科研论文、3 项发明专利等成果,以及 RuleGPT 源代码、4600 条训练集、500 条评估集和视频、图片等多模态规则文件。其填补了多模态监管规则数据空白,为相关模型训练与性能评估提供关键支撑,可推动监管语言理论创新与智能监管工具开发,助力跨领域监管协同,具有重要学术与应用价值。数据集在国家基础科学数据中心完全开放共享,任何科研机构、企业或个人均可免费获取,用于学术研究与非商业应用。
提供机构:
浙江大学



