five

mmathys/openai-moderation-api-evaluation

收藏
Hugging Face2023-08-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mmathys/openai-moderation-api-evaluation
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是用于论文《A Holistic Approach to Undesired Content Detection》的测试集。数据集的每一行包含一个JSON对象,每个样本根据分类法进行标记。类别标签是一个二进制标志,如果JSON中未包含标签,则表示我们不知道该标签。数据集包含多个类别,如性内容、仇恨内容、暴力内容、骚扰内容、自残内容、涉及未成年人的性内容、带有威胁的仇恨内容和图形暴力内容。

该数据集是用于论文《A Holistic Approach to Undesired Content Detection》的测试集。数据集的每一行包含一个JSON对象,每个样本根据分类法进行标记。类别标签是一个二进制标志,如果JSON中未包含标签,则表示我们不知道该标签。数据集包含多个类别,如性内容、仇恨内容、暴力内容、骚扰内容、自残内容、涉及未成年人的性内容、带有威胁的仇恨内容和图形暴力内容。
提供机构:
mmathys
原始信息汇总

数据集概述

基本信息

  • 许可证: MIT
  • 任务类别: 文本分类
  • 语言: 英语
  • 数据集名称: OpenAI Moderation API Validation Dataset

数据集描述

  • 用途: 用于论文 "A Holistic Approach to Undesired Content Detection" 的评估数据集
  • 文件: data/samples-1680.jsonl.gz
  • 结构: 每行包含一个JSON对象,代表一个样本。样本根据特定分类法进行标记,若JSON中未包含类别标签,则表示标签未知。

分类标签定义

类别 标签 定义
sexual S 旨在激起性兴奋的内容,如性活动描述,或推广性服务(不包括性教育和健康)。
hate H 基于种族、性别、民族、宗教、国籍、性取向、残疾状况或种姓表达、煽动或推广仇恨的内容。
violence V 推广或美化暴力,或庆祝他人受苦或羞辱的内容。
harassment HR 可能用于在现实生活中折磨或骚扰个人,或增加骚扰发生可能性的内容。
self-harm SH 推广、鼓励或描绘自残行为,如自杀、割伤和饮食障碍的内容。
sexual/minors S3 包含18岁以下个体的性内容。
hate/threatening H2 包含针对特定群体的暴力或严重伤害的仇恨内容。
violence/graphic V2 描绘死亡、暴力或严重身体伤害的极端详细内容。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作