非安全及诱导类拦截数据
收藏北京国际大数据交易所2024-08-16 收录
下载链接:
https://webs.bjidex.com/sys-bsc-home/#/bscConsole/tradingMarket/detail?id=2578
下载链接
链接失效反馈官方服务:
资源简介:
数据量:约62000条数据内容:涵盖5大类数据,分别为政治敏感;暴力;色情;脏话;诱导数据规模:约1.2万条,3000条/类采集方式:专业标注人员编写储存格式:txt、xls语言:中/英文
Dataset Description:
Total data volume: Approximately 62,000 entries.
Covered categories: The dataset encompasses 5 categories of content, namely politically sensitive content, violence-related content, pornographic content, vulgar language content, and inducing content.
Per-category data scale: Approximately 12,000 entries in total, with 3,000 entries per category.
Collection method: Compiled by professional annotators.
Storage formats: TXT and XLS.
Languages: Chinese and English.
提供机构:
北京智境云创科技有限公司
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含约6.2万条中英文内容,涵盖政治敏感、暴力、色情、脏话和诱导五大类,每类约3000条数据,由专业标注人员编写并以txt和xls格式存储。
以上内容由遇见数据集搜集并总结生成



