five

珍珠类微信视频号直播带货违法监测预警数据|直播监控数据集|违法预警数据集

收藏
浙江省数据知识产权登记平台2024-07-18 更新2024-07-19 收录
直播监控
违法预警
下载链接:
https://www.zjip.org.cn/home/announce/trends/39274
下载链接
链接失效反馈
资源简介:
对采集的微信视频号平台带货品类为珍珠类的达人直播视频内容进行转译分析,对达人口播语言内容进行处理、分析,根据达人在直播过程中对预先设置的违规敏感词(比如:光滑细腻,天然眩光,孤品,s级,纯天然,925银防过敏,近珠光等)违反的次数和频率,依据触发条件规则提出警告或处理。为诸暨市市场监督局管理区域内规范企业微信视频号直播行为,提供数据支持。"将采集完成的直播视频进行进行预处理,第一步:基于原始视频文件,以最大10分钟单位对原始视频进行切片。第二步:对于已完成的切片视频,进行视频内容转语音操作。第三步:对于已完成视频转语音操作的切片,进行语音转文本操作。第四步:使用OCR技术对原始视频中抓取的图片进行文字提取操作。第五步:将所得到的文字内容与违法预警关键词库进行匹配。最终运用多标准决策分析模型,对主播在直播过程中出现的违规语句进行分析计算,得出违法预警值和是否预警判断。 违法预警值=(违法预警单关键词命中次数*0.25)+(违法预警组合关键词命中次数* 0.3)+(图片识别命中预警组合关键词个数*0.35)+(直播间近一个月历史违规记录数*0.1) 通过公式计算出最终违法预警值,违法预警值 ≤1 时,不触发预警提示,违法预警值 >1 时触发违法预警提示。"
提供机构:
诸暨市市场监督管理局,浙江富润数链科技有限公司
创建时间:
2024-06-24
原始信息汇总

数据集概述

数据集名称

浙江省数据知识产权登记平台

数据集描述

浙江省数据知识产权登记平台是由浙江知识产权研究与服务中心推出的区块链数据知识产权登记系统。该系统支持数据知识产权登记、知识产权证书申请、原创作品登记确权、维权服务申请、维权证据出具、知识产权转让等多种场景。

主要功能

  • 数据知识产权登记
  • 知识产权证书申请
  • 原创作品登记确权
  • 维权服务申请
  • 维权证据出具
  • 知识产权转让

关键词

区块链、知识产权、数据存证、知识产权存证、知识产权研究与服务中心、数据知识产权登记、浙江省数据知识产权登记平台

AI搜集汇总
数据集介绍
main_image_url
特点
该数据集用于监测微信视频号平台上珍珠类直播带货的违法行为,通过分析直播内容中的关键词和组合关键词,结合OCR技术和多标准决策分析模型,计算违法预警值并判断是否触发预警。数据集规模为1561条,每季度更新一次,主要应用于规范企业微信视频号直播行为。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国劳动力动态调查

“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。

中国学术调查数据资料库 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

AIS数据集

该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。

github 收录

Wind Turbine Data

该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录