mmathys/openai-moderation-api-evaluation

Name: mmathys/openai-moderation-api-evaluation
Creator: mmathys
Published: 2023-08-28 14:56:39
License: 暂无描述

Hugging Face2023-08-28 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/mmathys/openai-moderation-api-evaluation

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是用于论文《A Holistic Approach to Undesired Content Detection》的测试集。数据集的每一行包含一个JSON对象，每个样本根据分类法进行标记。类别标签是一个二进制标志，如果JSON中未包含标签，则表示我们不知道该标签。数据集包含多个类别，如性内容、仇恨内容、暴力内容、骚扰内容、自残内容、涉及未成年人的性内容、带有威胁的仇恨内容和图形暴力内容。

提供机构：

mmathys

原始信息汇总

数据集概述

基本信息

许可证: MIT
任务类别: 文本分类
语言: 英语
数据集名称: OpenAI Moderation API Validation Dataset

数据集描述

用途: 用于论文 "A Holistic Approach to Undesired Content Detection" 的评估数据集
文件: data/samples-1680.jsonl.gz
结构: 每行包含一个JSON对象，代表一个样本。样本根据特定分类法进行标记，若JSON中未包含类别标签，则表示标签未知。

分类标签定义

类别	标签	定义
sexual	`S`	旨在激起性兴奋的内容，如性活动描述，或推广性服务（不包括性教育和健康）。
hate	`H`	基于种族、性别、民族、宗教、国籍、性取向、残疾状况或种姓表达、煽动或推广仇恨的内容。
violence	`V`	推广或美化暴力，或庆祝他人受苦或羞辱的内容。
harassment	`HR`	可能用于在现实生活中折磨或骚扰个人，或增加骚扰发生可能性的内容。
self-harm	`SH`	推广、鼓励或描绘自残行为，如自杀、割伤和饮食障碍的内容。
sexual/minors	`S3`	包含18岁以下个体的性内容。
hate/threatening	`H2`	包含针对特定群体的暴力或严重伤害的仇恨内容。
violence/graphic	`V2`	描绘死亡、暴力或严重身体伤害的极端详细内容。

5,000+

优质数据集

54 个

任务类型

进入经典数据集