用于多格式版权文件数据提取技术的正则表达式数据集
收藏国家基础学科公共科学数据中心2024-03-05 收录
下载链接:
https://www.nbsdc.cn/general/dataDetail?id=64ef2e87bb16e07b0603add7&type=1
下载链接
链接失效反馈官方服务:
资源简介:
针对项目中的多格式版权文件数据提取技术,在该技术的开发过程中,经过长期实践总结得到一系列用于版权文件数据识别、提取的正则表达式数据,数据采集方式为从各个第三方资源接入工具代码中提取出表达式并汇总成表,每一条表达式对应一个注释内容便于理解和使用,制成Excel表格形成数据集。数据类型为文本,数据格式为xlsx,可用Microsoft Excel、WPS等通用办公软件打开,数据量为30KB。
提供机构:
掌阅科技股份有限公司
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含一系列从第三方资源接入工具代码中提取的正则表达式,专门用于多格式版权文件的数据识别与提取。数据以Excel表格形式存储,每条表达式均附有注释,便于理解和使用。
以上内容由遇见数据集搜集并总结生成



