five

中国移动互联网治理行业内容治理文本数据集

收藏
国家数据集管理服务平台2026-05-28 更新2026-04-29 收录
下载链接:
https://www.ndsms.cn/dataRetrieval/datasetDetail/?id=8665d7dbb16c5579cdff4295bf6aefe0
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集聚焦互联网内容治理,包含垃圾文本、违规内容等负向内容信息样本及内容审核相关语料,体现典型的网络传播风险和平台治理需求。样本具有显著的场景化与治理导向特征,适合用于内容审核模型训练、违规内容识别、文本风险分层与平台合规治理能力建设。

This dataset focuses on internet content governance, containing samples of negative content information such as spam texts and violative content, as well as corpora related to content moderation. It reflects typical online communication risks and platform governance demands. The samples have notable contextualized and governance-oriented characteristics, and are suitable for training content moderation models, detecting violative content, conducting text risk stratification, and developing platform compliance governance capabilities.
提供机构:
中移九天人工智能科技(北京)有限公司
创建时间:
2026-04-23
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集专注于互联网内容治理,包含垃圾文本、违规内容等负向信息样本及审核语料,反映了典型的网络传播风险和平台治理需求。其样本具有场景化与治理导向特征,适用于内容审核模型训练、违规内容识别、文本风险分层及平台合规治理能力建设。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务