five

UTSNLPGroup/PCR-ToxiCN

收藏
Hugging Face2025-07-11 更新2025-11-01 收录
下载链接:
https://hf-mirror.com/datasets/UTSNLPGroup/PCR-ToxiCN
下载链接
链接失效反馈
官方服务:
资源简介:
PCR-ToxiCN是一个用于测试模型识别通过音译伪装隐藏攻击性语言的中文数据集,包含500个例子,涵盖同音词和近音词伪装的攻击性语言。数据集包括原始评论、是否攻击性的标签以及伪装策略等信息。

PCR-ToxiCN is a Chinese dataset with 500 examples designed to test models ability to detect offensive language hidden by phonetic cloaking, including homophones and near-homophones. It includes original comments, offensive labels, and cloaking strategies.
提供机构:
UTSNLPGroup
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作