Snoopy04/realtoxicity-1k
收藏Hugging Face2024-01-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Snoopy04/realtoxicity-1k
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: filename
dtype: string
- name: begin
dtype: int64
- name: end
dtype: int64
- name: challenging
dtype: bool
- name: prompt
struct:
- name: flirtation
dtype: float64
- name: identity_attack
dtype: float64
- name: insult
dtype: float64
- name: profanity
dtype: float64
- name: severe_toxicity
dtype: float64
- name: sexually_explicit
dtype: float64
- name: text
dtype: string
- name: threat
dtype: float64
- name: toxicity
dtype: float64
- name: continuation
struct:
- name: flirtation
dtype: float64
- name: identity_attack
dtype: float64
- name: insult
dtype: float64
- name: profanity
dtype: float64
- name: severe_toxicity
dtype: float64
- name: sexually_explicit
dtype: float64
- name: text
dtype: string
- name: threat
dtype: float64
- name: toxicity
dtype: float64
splits:
- name: train
num_bytes: 335748
num_examples: 1000
download_size: 308983
dataset_size: 335748
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
提供机构:
Snoopy04
原始信息汇总
数据集概述
数据特征
- filename: 文件名,数据类型为字符串。
- begin: 开始位置,数据类型为64位整数。
- end: 结束位置,数据类型为64位整数。
- challenging: 是否具有挑战性,数据类型为布尔值。
- prompt: 提示信息,包含以下子特征:
- flirtation: 调情程度,数据类型为64位浮点数。
- identity_attack: 身份攻击程度,数据类型为64位浮点数。
- insult: 侮辱程度,数据类型为64位浮点数。
- profanity: 亵渎程度,数据类型为64位浮点数。
- severe_toxicity: 严重毒性程度,数据类型为64位浮点数。
- sexually_explicit: 性暗示程度,数据类型为64位浮点数。
- text: 文本内容,数据类型为字符串。
- threat: 威胁程度,数据类型为64位浮点数。
- toxicity: 毒性程度,数据类型为64位浮点数。
- continuation: 延续信息,包含以下子特征:
- flirtation: 调情程度,数据类型为64位浮点数。
- identity_attack: 身份攻击程度,数据类型为64位浮点数。
- insult: 侮辱程度,数据类型为64位浮点数。
- profanity: 亵渎程度,数据类型为64位浮点数。
- severe_toxicity: 严重毒性程度,数据类型为64位浮点数。
- sexually_explicit: 性暗示程度,数据类型为64位浮点数。
- text: 文本内容,数据类型为字符串。
- threat: 威胁程度,数据类型为64位浮点数。
- toxicity: 毒性程度,数据类型为64位浮点数。
数据分割
- train: 训练集,包含1000个样本,总字节数为335748。
数据集大小
- 下载大小: 308983字节。
- 数据集大小: 335748字节。
配置
- default: 默认配置,包含训练集数据文件路径为
data/train-*。



