mmathys/openai-moderation-api-evaluation
收藏Hugging Face2023-08-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mmathys/openai-moderation-api-evaluation
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是用于论文《A Holistic Approach to Undesired Content Detection》的测试集。数据集的每一行包含一个JSON对象,每个样本根据分类法进行标记。类别标签是一个二进制标志,如果JSON中未包含标签,则表示我们不知道该标签。数据集包含多个类别,如性内容、仇恨内容、暴力内容、骚扰内容、自残内容、涉及未成年人的性内容、带有威胁的仇恨内容和图形暴力内容。
该数据集是用于论文《A Holistic Approach to Undesired Content Detection》的测试集。数据集的每一行包含一个JSON对象,每个样本根据分类法进行标记。类别标签是一个二进制标志,如果JSON中未包含标签,则表示我们不知道该标签。数据集包含多个类别,如性内容、仇恨内容、暴力内容、骚扰内容、自残内容、涉及未成年人的性内容、带有威胁的仇恨内容和图形暴力内容。
提供机构:
mmathys
原始信息汇总
数据集概述
基本信息
- 许可证: MIT
- 任务类别: 文本分类
- 语言: 英语
- 数据集名称: OpenAI Moderation API Validation Dataset
数据集描述
- 用途: 用于论文 "A Holistic Approach to Undesired Content Detection" 的评估数据集
- 文件:
data/samples-1680.jsonl.gz - 结构: 每行包含一个JSON对象,代表一个样本。样本根据特定分类法进行标记,若JSON中未包含类别标签,则表示标签未知。
分类标签定义
| 类别 | 标签 | 定义 |
|---|---|---|
| sexual | S |
旨在激起性兴奋的内容,如性活动描述,或推广性服务(不包括性教育和健康)。 |
| hate | H |
基于种族、性别、民族、宗教、国籍、性取向、残疾状况或种姓表达、煽动或推广仇恨的内容。 |
| violence | V |
推广或美化暴力,或庆祝他人受苦或羞辱的内容。 |
| harassment | HR |
可能用于在现实生活中折磨或骚扰个人,或增加骚扰发生可能性的内容。 |
| self-harm | SH |
推广、鼓励或描绘自残行为,如自杀、割伤和饮食障碍的内容。 |
| sexual/minors | S3 |
包含18岁以下个体的性内容。 |
| hate/threatening | H2 |
包含针对特定群体的暴力或严重伤害的仇恨内容。 |
| violence/graphic | V2 |
描绘死亡、暴力或严重身体伤害的极端详细内容。 |



