five

教育培训类快手直播带货违法监测预警数据

收藏
浙江省数据知识产权登记平台2024-07-18 更新2024-07-19 收录
下载链接:
https://www.zjip.org.cn/home/announce/trends/39292
下载链接
链接失效反馈
官方服务:
资源简介:
对采集的快手平台带货品类为教育培训类的达人直播视频内容进行转译分析,对达人口播语言内容进行处理、分析,根据达人在直播过程中对预先设置的违规敏感词(比如:成绩飞跃,过目不忘,记住永不忘,通过率,高分王者,名列前茅,百分百高薪就业,国家承认,命题专家联手,圈定考试范围等)违反的次数和频率,依据触发条件规则提出警告或处理。为诸暨市市场监督局管理区域内规范企业快手直播行为,提供数据支持。将采集完成的直播视频进行进行预处理,第一步:基于原始视频文件,以最大10分钟单位对原始视频进行切片。第二步:对于已完成的切片视频,进行视频内容转语音操作。第三步:对于已完成视频转语音操作的切片,进行语音转文本操作。第四步:使用OCR技术对原始视频中抓取的图片进行文字提取操作。第五步:将所得到的文字内容与违法预警关键词库进行匹配。最终运用多标准决策分析模型,对主播在直播过程中出现的违规语句进行分析计算,得出违法预警值和是否预警判断。 违法预警值=(违法预警单关键词命中次数*0.25)+(违法预警组合关键词命中次数* 0.3)+(图片识别命中预警组合关键词个数*0.35)+(直播间近一个月历史违规记录数*0.1) 通过公式计算出最终违法预警值,违法预警值 ≤1 时,不触发预警提示,违法预警值 >1 时触发违法预警提示。

This study conducts transcription and analysis on collected Kuaishou live stream videos from influencers in the education and training e-commerce sector. It processes and analyzes the spoken content of the influencers during live broadcasts. Warnings or corresponding penalties will be issued in accordance with pre-defined trigger rules, based on the frequency and count of violations against pre-configured sensitive violation keywords, including but not limited to 'academic performance skyrockets', 'never forget after one reading', 'remember permanently', 'pass rate', 'top scorer', 'rank among the top', '100% high-salary employment', 'state-recognized', 'jointly organized by exam question-setting experts', 'designated exam scope'. This work provides data support for the Market Supervision Administration of Zhuji City to standardize the live streaming behaviors of enterprises within its jurisdiction on the Kuaishou platform. The collected live stream videos undergo the following preprocessing steps: 1. Slice the original video files into segments with a maximum duration of 10 minutes each. 2. Convert the sliced videos into audio content. 3. Perform speech-to-text conversion on the audio content of the sliced videos. 4. Extract text from images captured from the original videos using OCR technology. 5. Match the obtained text content against the violation warning keyword database. Finally, a multi-criteria decision analysis model is applied to analyze and calculate the violation statements made by the streamer during the live broadcast, to derive the violation warning score and determine whether to trigger a warning. The violation warning score is calculated using the following formula: Violation Warning Score = (Number of single violation warning keywords hit * 0.25) + (Number of combined violation warning keywords hit * 0.3) + (Number of combined warning keywords detected via image recognition * 0.35) + (Number of the streamer's historical violation records in the past month * 0.1) According to the calculation results, no warning will be triggered if the violation warning score ≤ 1, and a violation warning will be triggered if the score > 1.
提供机构:
诸暨市市场监督管理局,浙江富润数链科技有限公司
创建时间:
2024-06-26
原始信息汇总

数据集概述

数据集名称

浙江省数据知识产权登记平台

数据集描述

浙江省数据知识产权登记平台是由浙江知识产权研究与服务中心推出的区块链数据知识产权登记系统。该平台支持数据知识产权登记、知识产权证书申请、原创作品登记确权、维权服务申请、维权证据出具、知识产权转让等多种场景。

关键功能

  • 数据知识产权登记
  • 知识产权证书申请
  • 原创作品登记确权
  • 维权服务申请
  • 维权证据出具
  • 知识产权转让

应用场景

  • 数据知识产权登记
  • 知识产权证书申请
  • 原创作品登记确权
  • 维权服务申请
  • 维权证据出具
  • 知识产权转让

关键词

区块链、知识产权、数据存证、知识产权存证、知识产权研究与服务中心、数据知识产权登记、浙江省数据知识产权登记平台

搜集汇总
数据集介绍
main_image_url
特点
该数据集是一个用于监测快手平台教育培训类直播带货违法行为的数据集,包含1450条记录,每季度更新一次。通过分析直播内容中的关键词命中情况计算违法预警值,并根据预警值判断是否触发预警,旨在规范企业快手直播行为。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务