著作权审查记录与驳回原因统计分析数据集
收藏贵州省数据知识产权登记平台2026-04-13 更新2026-04-14 收录
下载链接:
https://gzdipp.gzsis.cn:12020/noticeDetail?id=2616&type=1
下载链接
链接失效反馈官方服务:
资源简介:
本数据集通过对平台原始审查日志与驳回记录进行深度加工形成,核心处理规则与算法流程如下:
1. 数据抽取与脱敏:从审查系统日志中提取结构化和半结构化字段(审查决定、驳回时间、审查员ID、作品类型、申请人地区),并对审查员姓名、申请人联系方式等个人敏感信息进行不可逆脱敏处理。
2. 驳回原因标准化编码:针对原始驳回意见中的自由文本(如“图样像素过低”),采用自然语言处理与关键词匹配算法,将其映射至统一的三级驳回原因代码体系(如:A-材料规范性 > A01-样本图样不符合要求 > A0101-图样像素低于300dpi)。
3. 多维度统计指标加工:基于时间窗口(月/季/年),分别计算总体驳回率、各作品类型驳回率、各审查员驳回率、各驳回原因占比等衍生统计指标,形成可用于趋势分析和对比分析的宽表数据集。
提供机构:
贵州中云版权科技有限公司
创建时间:
2026-04-09
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集基于超过11.5万条著作权审查记录,通过自然语言处理技术将自由文本驳回原因标准化为统一的三级代码体系,并计算多维度统计指标如驳回率。它主要用于审查质量监控和申请材料智能预检,帮助识别审查一致性问题和提升申请通过率,具有月度更新的特点。
以上内容由遇见数据集搜集并总结生成



