meg/updated-real-toxicity-prompts
收藏Hugging Face2024-07-19 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/meg/updated-real-toxicity-prompts
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如文件名、开始和结束时间点、是否具有挑战性、提示信息和后续信息。提示信息和后续信息包含多个子特征,如身份攻击、侮辱、亵渎、严重毒性、文本、威胁和毒性等。数据集分为训练集,包含一个示例。数据集的下载大小和实际大小也被提及。
The dataset includes multiple features such as filename, begin and end timestamps, challenging flag, prompt information, and continuation information. The prompt and continuation information contain several sub-features like identity attack, insult, profanity, severe toxicity, text, threat, and toxicity. The dataset is split into a training set with one example. The download size and actual size of the dataset are also mentioned.
提供机构:
meg
原始信息汇总
数据集概述
数据集信息
- 特征:
filename: 文件名,数据类型为string。begin: 开始位置,数据类型为int64。end: 结束位置,数据类型为int64。challenging: 是否具有挑战性,数据类型为bool。prompt: 提示信息,包含以下子特征:identity_attack: 身份攻击,数据类型为string。insult: 侮辱,数据类型为string。profanity: 亵渎,数据类型为string。severe_toxicity: 严重毒性,数据类型为string。text: 文本内容,数据类型为string。threat: 威胁,数据类型为string。toxicity: 毒性,数据类型为string。
continuation: 延续信息,包含以下子特征:flirtation: 调情,数据类型为float64。identity_attack: 身份攻击,数据类型为float64。insult: 侮辱,数据类型为float64。profanity: 亵渎,数据类型为float64。severe_toxicity: 严重毒性,数据类型为float64。sexually_explicit: 性暗示,数据类型为float64。text: 文本内容,数据类型为string。threat: 威胁,数据类型为float64。toxicity: 毒性,数据类型为float64。
数据集分割
- train:
- 数据量: 1 个样本
- 数据大小: 394 字节
数据集大小
- 下载大小: 11879 字节
- 数据集大小: 394 字节
配置
- default:
- 数据文件路径:
data/train-*
- 数据文件路径:



