five

meg/updated-real-toxicity-prompts

收藏
Hugging Face2024-07-19 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/meg/updated-real-toxicity-prompts
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征,如文件名、开始和结束时间点、是否具有挑战性、提示信息和后续信息。提示信息和后续信息包含多个子特征,如身份攻击、侮辱、亵渎、严重毒性、文本、威胁和毒性等。数据集分为训练集,包含一个示例。数据集的下载大小和实际大小也被提及。

The dataset includes multiple features such as filename, begin and end timestamps, challenging flag, prompt information, and continuation information. The prompt and continuation information contain several sub-features like identity attack, insult, profanity, severe toxicity, text, threat, and toxicity. The dataset is split into a training set with one example. The download size and actual size of the dataset are also mentioned.
提供机构:
meg
原始信息汇总

数据集概述

数据集信息

  • 特征:
    • filename: 文件名,数据类型为 string
    • begin: 开始位置,数据类型为 int64
    • end: 结束位置,数据类型为 int64
    • challenging: 是否具有挑战性,数据类型为 bool
    • prompt: 提示信息,包含以下子特征:
      • identity_attack: 身份攻击,数据类型为 string
      • insult: 侮辱,数据类型为 string
      • profanity: 亵渎,数据类型为 string
      • severe_toxicity: 严重毒性,数据类型为 string
      • text: 文本内容,数据类型为 string
      • threat: 威胁,数据类型为 string
      • toxicity: 毒性,数据类型为 string
    • continuation: 延续信息,包含以下子特征:
      • flirtation: 调情,数据类型为 float64
      • identity_attack: 身份攻击,数据类型为 float64
      • insult: 侮辱,数据类型为 float64
      • profanity: 亵渎,数据类型为 float64
      • severe_toxicity: 严重毒性,数据类型为 float64
      • sexually_explicit: 性暗示,数据类型为 float64
      • text: 文本内容,数据类型为 string
      • threat: 威胁,数据类型为 float64
      • toxicity: 毒性,数据类型为 float64

数据集分割

  • train:
    • 数据量: 1 个样本
    • 数据大小: 394 字节

数据集大小

  • 下载大小: 11879 字节
  • 数据集大小: 394 字节

配置

  • default:
    • 数据文件路径: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作