Snoopy04/realtoxicity-2k
收藏Hugging Face2024-01-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Snoopy04/realtoxicity-2k
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: filename
dtype: string
- name: begin
dtype: int64
- name: end
dtype: int64
- name: challenging
dtype: bool
- name: prompt
struct:
- name: flirtation
dtype: float64
- name: identity_attack
dtype: float64
- name: insult
dtype: float64
- name: profanity
dtype: float64
- name: severe_toxicity
dtype: float64
- name: sexually_explicit
dtype: float64
- name: text
dtype: string
- name: threat
dtype: float64
- name: toxicity
dtype: float64
- name: continuation
struct:
- name: flirtation
dtype: float64
- name: identity_attack
dtype: float64
- name: insult
dtype: float64
- name: profanity
dtype: float64
- name: severe_toxicity
dtype: float64
- name: sexually_explicit
dtype: float64
- name: text
dtype: string
- name: threat
dtype: float64
- name: toxicity
dtype: float64
splits:
- name: train
num_bytes: 670799
num_examples: 2000
download_size: 608415
dataset_size: 670799
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征字段:
- 名称:filename(文件名),数据类型:字符串(string)
- 名称:begin(起始位置),数据类型:64位整数(int64)
- 名称:end(结束位置),数据类型:64位整数(int64)
- 名称:challenging(标注难度),数据类型:布尔值(bool)
- 名称:prompt(提示文本结构体):
包含子字段:
- flirtation(调情程度):64位浮点型(float64)
- identity_attack(身份攻击程度):64位浮点型(float64)
- insult(侮辱程度):64位浮点型(float64)
- profanity(脏话/亵渎程度):64位浮点型(float64)
- severe_toxicity(严重恶意程度):64位浮点型(float64)
- sexually_explicit(色情内容程度):64位浮点型(float64)
- text(文本内容):字符串类型
- threat(威胁程度):64位浮点型(float64)
- toxicity(恶意程度):64位浮点型(float64)
- 名称:continuation(续作文本结构体):
包含子字段:
- flirtation(调情程度):64位浮点型(float64)
- identity_attack(身份攻击程度):64位浮点型(float64)
- insult(侮辱程度):64位浮点型(float64)
- profanity(脏话/亵渎程度):64位浮点型(float64)
- severe_toxicity(严重恶意程度):64位浮点型(float64)
- sexually_explicit(色情内容程度):64位浮点型(float64)
- text(文本内容):字符串类型
- threat(威胁程度):64位浮点型(float64)
- toxicity(恶意程度):64位浮点型(float64)
数据集划分:
- 划分名称:train(训练集),占用字节数:670799,样本数量:2000
下载大小:608415
数据集总大小:670799
配置项:
- 配置名称:default(默认配置),数据文件:
- 划分:train(训练集),文件路径:data/train-*
提供机构:
Snoopy04
原始信息汇总
数据集概述
数据集特征
- filename: 文件名,数据类型为字符串。
- begin: 开始位置,数据类型为整数。
- end: 结束位置,数据类型为整数。
- challenging: 是否具有挑战性,数据类型为布尔值。
- prompt: 提示信息,包含以下子特征:
- flirtation: 调情程度,数据类型为浮点数。
- identity_attack: 身份攻击程度,数据类型为浮点数。
- insult: 侮辱程度,数据类型为浮点数。
- profanity: 亵渎程度,数据类型为浮点数。
- severe_toxicity: 严重毒性程度,数据类型为浮点数。
- sexually_explicit: 性暗示程度,数据类型为浮点数。
- text: 文本内容,数据类型为字符串。
- threat: 威胁程度,数据类型为浮点数。
- toxicity: 毒性程度,数据类型为浮点数。
- continuation: 延续信息,包含以下子特征:
- flirtation: 调情程度,数据类型为浮点数。
- identity_attack: 身份攻击程度,数据类型为浮点数。
- insult: 侮辱程度,数据类型为浮点数。
- profanity: 亵渎程度,数据类型为浮点数。
- severe_toxicity: 严重毒性程度,数据类型为浮点数。
- sexually_explicit: 性暗示程度,数据类型为浮点数。
- text: 文本内容,数据类型为字符串。
- threat: 威胁程度,数据类型为浮点数。
- toxicity: 毒性程度,数据类型为浮点数。
数据集划分
- train: 训练集,包含2000个样本,占用670799字节。
数据集大小
- 下载大小: 608415字节。
- 数据集大小: 670799字节。
配置
- default: 默认配置,包含训练集文件路径为
data/train-*。
搜集汇总
数据集介绍

构建方式
在自然语言处理领域,评估生成文本的毒性水平是确保模型安全部署的关键环节。realtoxicity-2k数据集通过精心设计的流程构建而成,其核心方法是从真实网络文本中提取具有潜在毒性的提示,并利用先进的语言模型生成对应的续写内容。每个数据样本均包含原始提示文本及其自动生成的续写,同时通过预训练的毒性分类器对两者进行多维度毒性评分,涵盖侮辱、威胁、身份攻击等细分类别。这种构建方式确保了数据来源于真实语境,同时通过自动化标注流程实现了大规模、细粒度的毒性标签覆盖,为模型安全性评估提供了高质量基准。
特点
该数据集在毒性检测研究领域展现出鲜明的特色,其核心在于提供了双重文本序列及其对应的多维毒性量化指标。每个样本不仅包含原始提示和模型生成的续写文本,还附带了九类毒性属性的概率分数,如粗俗言语、性暗示内容及严重毒性等,形成了结构化的毒性谱系描述。数据集特别标注了部分样本的挑战性标签,指示那些毒性边界模糊或检测难度较高的实例,这为开发更稳健的毒性分类模型提供了关键训练与测试资源。其数据规模虽精炼为两千条样本,但凭借细致的标注维度和真实的文本来源,已成为评估生成模型安全性的重要工具。
使用方法
研究人员可借助该数据集深入探索语言模型的毒性生成机制与检测技术。典型应用场景包括训练或微调毒性分类模型,利用其丰富的多标签毒性分数作为监督信号,提升模型对细粒度毒性内容的识别能力。同时,该数据集可用于评估文本生成模型的安全性,通过分析模型在给定潜在毒性提示下的续写内容,量化其产生有害文本的倾向。在实验设计中,挑战性样本可作为困难案例集,专门用于测试模型在复杂情境下的鲁棒性。数据以标准结构化格式提供,便于直接加载至主流机器学习框架进行后续分析与建模。
背景与挑战
背景概述
在自然语言处理领域,随着大规模语言模型的广泛应用,其生成内容的安全性评估成为一项紧迫的研究议题。由Snoopy04发布的realtoxicity-2k数据集,旨在为语言模型的毒性检测提供精细化的评估基准。该数据集构建于2023年,核心研究聚焦于量化分析模型生成文本中的多重毒性维度,如侮辱、身份攻击、威胁及淫秽内容等,通过标注提示词与续写文本的毒性分数,为研究者提供了深入探究模型安全边界的实证基础,对推动人工智能伦理与内容过滤技术的发展具有显著影响力。
当前挑战
该数据集致力于解决语言模型生成内容毒性检测的复杂挑战,其核心难点在于毒性定义的多维性与主观性,不同文化背景和语境下,同一文本可能被赋予迥异的毒性评分,这要求评估体系具备高度的语境适应性与细粒度解析能力。在构建过程中,挑战主要源于数据标注的一致性保障,需协调众多标注者对隐含毒性内容的敏感度差异,同时确保提示词与续写文本在毒性维度上的分数标注既精确又可靠,以维持数据集的科学严谨性与实用价值。
常用场景
经典使用场景
在自然语言处理领域,毒性内容检测是确保语言模型安全性的核心任务之一。Snoopy04/realtoxicity-2k数据集通过提供带有精细毒性标注的文本片段,成为评估和提升模型在生成或分类任务中识别有害内容能力的基准工具。研究者常利用该数据集训练分类器,以区分文本中是否包含侮辱、威胁或身份攻击等毒性成分,进而优化模型的伦理边界。
衍生相关工作
围绕该数据集,学术界衍生出多项经典研究,例如基于其多标签毒性特征开发的深度学习分类模型,这些模型在毒性检测竞赛中表现突出。同时,它启发了对语言模型去偏见方法的研究,如通过对抗训练减少模型生成有毒文本的概率。这些工作共同丰富了人工智能安全领域的理论框架与实践工具。
数据集最近研究
最新研究方向
在自然语言处理领域,毒性内容检测始终是保障在线环境安全的核心议题。RealToxicity-2k数据集凭借其精细标注的毒性维度,为前沿研究提供了关键支撑。当前研究聚焦于利用该数据集训练多任务学习模型,以同时识别挑衅、身份攻击、侮辱等多类毒性特征,提升模型在复杂语境下的泛化能力。随着大语言模型生成内容的激增,该数据集被广泛用于评估生成文本的安全性,防止模型输出有害信息。相关热点事件,如社交媒体平台的内容审核挑战,进一步凸显了该数据集在构建鲁棒性检测系统中的实践价值。其影响深远,不仅推动了毒性检测技术的精细化发展,也为人工智能伦理治理提供了可量化的评估基准。
以上内容由遇见数据集搜集并总结生成



