five

面向不良视听内容的样本库与知识库

收藏
国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=697a32b5195d261c3361cd5b&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
面向不良视听内容的样本库与知识库为不良视听内容识别任务的支撑资源,涵盖网络平台中传播的违规视听内容,通过对视频、图像、文本、语音等多模态数据的采集、清洗与分类标注后,加工形成可支持不良内容检测的高质量资源。该样本库与知识库包含视频、图像、文本、语音4种模态的特征文件,都以txt文件格式存储:视频video模态下有CNN、帧内纹理、关键帧平均法3类,图像image模态下有颜色直方图、Canny算子、Sobel算子3类,文本text模态下有TF-IDF、Word2Vec词向量、BERT句子向量3类,语音audio模态下有MFCC梅尔频谱图、过零率3类,数据量约8GB。
提供机构:
国家广播电视总局广播电视科学研究院
二维码
社区交流群
二维码
科研交流群
商业服务