five

互联网新业态知识产权侵权监测与违法违规典型案例知识库

收藏
贵州省数据知识产权登记平台2026-04-29 更新2026-04-30 收录
下载链接:
https://gzdipp.gzsis.cn:12020/noticeDetail?id=2769&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集采用多模态AI大模型技术进行侵权线索的自动化发现与分类。核心技术包括:视频/音频流实时采集与关键帧提取,利用OCR(光学字符识别)和ASR(自动语音识别)将直播/短视频中的图文、语音内容转化为文本;基于自研多模态大模型(DiipOmni引擎)对文本、图像、音视频进行跨模态语义分析,自动识别虚假宣传、未授权直播、盗版、盗用、诋毁等侵权行为;通过NLP文本分类算法(BERT类模型)结合人工标注的真实违法违规知识库,实现十大二级风险分类(涉政涉恐、低俗内容、侵犯商标权等)的精准判定;采用聚类算法对侵权线索进行去重、聚合与关联分析,自动生成结构化侵权报告;结合时间戳与哈希校验技术完成一键电子固证,确保证据链完整可溯源。
提供机构:
北京深识科技有限公司
创建时间:
2026-04-27
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集由北京深识科技有限公司开发,包含26241条通过公开收集的互联网新业态知识产权侵权监测与违法违规典型案例知识。数据集利用多模态AI大模型技术,自动识别直播、短视频中的侵权行为(如未授权直播、盗版、盗用等),并结合人工标注的知识库进行模型训练,提升侵权检测的准确性和专业性,数据每月更新,适用于企业维权和侵权线索固证。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作