five

药食同源类京东直播带货违法监测预警数据

收藏
浙江省数据知识产权登记平台2024-11-01 更新2024-11-02 收录
下载链接:
https://www.zjip.org.cn/home/announce/trends/80132
下载链接
链接失效反馈
官方服务:
资源简介:
对采集的京东平台带货品类为药食同源类的达人直播视频内容进行转译分析,对达人口播语言内容进行处理、分析,根据达人在直播过程中对预先设置的违规敏感词(比如:彻底根治、绝对安全、无任何副作用、快速见效、立竿见影、包治百病、100%纯天然、预防疾病、抗癌、抗衰老、政府推荐等)违反的次数和频率,依据触发条件规则提出警告或处理。为服务辖区市场监督局管理区域内规范企业京东直播行为,提供数据支持。将采集完成的直播视频进行进行预处理,第一步:基于原始视频文件,以最大10分钟单位对原始视频进行切片。第二步:对于已完成的切片视频,进行视频内容转语音操作。第三步:对于已完成视频转语音操作的切片,进行语音转文本操作。第四步:使用OCR技术对原始视频中抓取的图片进行文字提取操作。第五步:将所得到的文字内容与违法预警关键词库进行匹配。最终运用多标准决策分析模型,对主播在直播过程中出现的违规语句进行分析计算,得出违法预警值和是否预警判断。 违法预警值=(违法预警单关键词命中次数*0.25)+(违法预警组合关键词命中次数* 0.3)+(图片识别命中预警组合关键词个数*0.35)+(直播间近一个月历史违规记录数*0.1) 通过公式计算出最终违法预警值,违法预警值 ≤1 时,不触发预警提示,违法预警值 >1 时触发违法预警提示。
提供机构:
浙江富润数链科技有限公司
创建时间:
2024-10-11
搜集汇总
数据集介绍
main_image_url
特点
该数据集主要用于监测京东平台上药食同源类直播带货中的违法行为,包含1492条记录,每季度更新一次。数据集通过分析直播视频内容中的违规敏感词,计算违法预警值,为市场监督局提供数据支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作