five

药食同源类抖音直播带货违法监测预警数据|直播带货监测数据集|药食同源合规数据集

收藏
浙江省数据知识产权登记平台2024-11-01 更新2024-11-02 收录
直播带货监测
药食同源合规
下载链接:
https://www.zjip.org.cn/home/announce/trends/79674
下载链接
链接失效反馈
资源简介:
对采集的抖音平台带货品类为药食同源类的达人直播视频内容进行转译分析,对达人口播语言内容进行处理、分析,根据达人在直播过程中对预先设置的违规敏感词(比如:彻底根治、绝对安全、无任何副作用、快速见效、立竿见影、包治百病、100%纯天然、预防疾病、抗癌、抗衰老、政府推荐等)违反的次数和频率,依据触发条件规则提出警告或处理。为服务辖区市场监督局管理区域内规范企业抖音直播行为,提供数据支持。将采集完成的直播视频进行进行预处理,第一步:基于原始视频文件,以最大10分钟单位对原始视频进行切片。第二步:对于已完成的切片视频,进行视频内容转语音操作。第三步:对于已完成视频转语音操作的切片,进行语音转文本操作。第四步:使用OCR技术对原始视频中抓取的图片进行文字提取操作。第五步:将所得到的文字内容与违法预警关键词库进行匹配。最终运用多标准决策分析模型,对主播在直播过程中出现的违规语句进行分析计算,得出违法预警值和是否预警判断。违法预警值 ≤1 时,不触发预警提示,违法预警值 >1 时触发违法预警提示。
提供机构:
浙江富润数链科技有限公司
创建时间:
2024-10-11
AI搜集汇总
数据集介绍
main_image_url
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

PAN-X

该数据集是Cross-lingual TRansfer Evaluation of Multilingual Encoders (XTREME)基准的一部分,名为WikiANN或PAN-X。它包含多种语言的维基百科文章,特别是瑞士四种最常用语言:德语、法语、意大利语和英语。每篇文章都使用LOC(位置)、PER(人物)和ORG(组织)标签在‘inside-outside-beginning’(IOB2)格式下进行了标注。

github 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

Chinese-Poetry-Corpus

本语料库收集自互联网,包含了从先秦到当代的古诗词数据,以CSV格式进行存储。经过去重后,包含诗词共计1014508首。古诗词按朝代进行划分,存储于文件夹下,命名规则为朝代.csv。每首诗词数据包含五个字段,分别为标题、朝代、作者、体裁、内容。

github 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录