seanius/toxic-or-neutral-text-labelled
收藏Hugging Face2024-06-09 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/seanius/toxic-or-neutral-text-labelled
下载链接
链接失效反馈官方服务:
资源简介:
数据集包含来自推文数据集、有害行为数据集和一些合成示例的标记文本,旨在训练文本分类器以检测冒犯性语言或对大型语言模型(LLM)的潜在有害请求。标签包括:中性、冒犯性语言、有害行为、仇恨言论。数据集的来源包括对LLM的有害请求、带有仇恨或冒犯性语言的推文以及通过Python脚本和英语短语模板生成的合成示例。
数据集包含来自推文数据集、有害行为数据集和一些合成示例的标记文本,旨在训练文本分类器以检测冒犯性语言或对大型语言模型(LLM)的潜在有害请求。标签包括:中性、冒犯性语言、有害行为、仇恨言论。数据集的来源包括对LLM的有害请求、带有仇恨或冒犯性语言的推文以及通过Python脚本和英语短语模板生成的合成示例。
提供机构:
seanius
原始信息汇总
数据集概述
数据来源
- 有害行为请求数据集:来源于harmful_behaviors。
- 推文数据集:包含仇恨或攻击性语言的推文,来源于hate-speech-and-offensive-language-dataset。
- 合成示例:约1.5k个合成示例,通过Python脚本和英语短语模板生成。
数据用途
用于训练文本分类器,以检测攻击性语言或对大型语言模型的潜在有害请求。
标签分类
数据集包含以下标签:
- neutral
- offensive_language
- harmful_behaviour
- hate_speech



