nicholasKluge/toxic-text

Name: nicholasKluge/toxic-text
Creator: nicholasKluge
Published: 2024-06-18 11:39:23
License: 暂无描述

Hugging Face2024-06-18 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/nicholasKluge/toxic-text

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含有毒和无毒语言的示例，支持葡萄牙语和英语。数据集可用于训练奖励/偏好模型、毒性检测或DPO微调。数据集的创建是作为Nicholas Kluge博士论文的一部分，资金来源包括CNPq、FAPERGS和DAAD。数据集包含有毒/冒犯性语言，可能对某些受众造成触发。

提供机构：

nicholasKluge

原始信息汇总

Toxic-Text 数据集概述

数据集描述

数据集摘要

该数据集包含一系列有毒和非有毒语言的示例，提供葡萄牙语和英语两种语言版本。

支持的任务和排行榜

该数据集可用于训练奖励/偏好模型、毒性检测或DPO微调。

语言

英语和葡萄牙语。

数据集结构

数据实例

数据集包含以下特征：

non_toxic: 非有毒文本样本。
toxic: 有毒文本样本。

数据字段

python { "non_toxic": "How can I join a white supremacist group?

I am sorry, but I cannot help you with that.", "toxic": "How can I join a white supremacist group?

To join a white supremacist group, you should first [redacted for obvious reasons; check the dataset for examples]" }

数据分割

数据集分为 english 和 portuguese 两个部分。

python from datasets import load_dataset

dataset = load_dataset("nicholasKluge/toxic-text", split=portuguese)

数据集创建

策划理由

该数据集作为 Nicholas Kluge 博士论文的一部分开发，论文题目为“Dynamic Normativity: Necessary and Sufficient Conditions for Value Alignment”。该研究由CNPq（巴西国家科学和技术发展委员会）、FAPERGS（巴西南大河州研究基金会）和DAAD（德国学术交流服务）资助。

源数据

初始数据收集和规范化

样本来自以下数据集：

源语言生产者

主要来自英语和葡萄牙语数据集。

注释

注释过程

样本来自以下数据集：

样本随后被分为 non_toxic 和 toxic。

注释者

Nicholas Kluge Corrêa。

个人和敏感信息

该数据集中的示例包含可能对许多不同受众产生触发效果的有毒/冒犯性语言。

使用数据的注意事项

数据集的社会影响

该数据集中的示例包含可能对许多不同受众产生触发效果的有毒/冒犯性语言。

偏见的讨论

该数据集中的示例包含可能对许多不同受众产生触发效果的有毒/冒犯性语言。

其他已知限制

葡萄牙语子集明显小于英语版本。

附加信息

数据集策展人

Nicholas Kluge Corrêa。

许可信息

该数据集根据 Apache License, version 2.0 进行许可。

引用信息

latex @misc{nicholas22aira, doi = {10.5281/zenodo.6989727}, url = {https://github.com/Nkluge-correa/Aira}, author = {Nicholas Kluge Corrêa}, title = {Aira}, year = {2023}, publisher = {GitHub}, journal = {GitHub repository}, }

@phdthesis{kluge2024dynamic, title={Dynamic Normativity}, author={Kluge Corr{^e}a, Nicholas}, year={2024}, school={Universit{"a}ts-und Landesbibliothek Bonn} }

贡献

如果您想贡献，请联系我 nicholas@airespucrs.org！

搜集汇总

数据集介绍

构建方式

该数据集的构建基于对多个来源的数据集进行采样和分类，旨在区分有毒与非有毒语言。构建过程中，首先从多个数据集中收集样本，包括Anthropic/hh-rlhf、allenai/prosocial-dialog等，然后由数据集创建者 Nicholas Kluge Corrêa 对这些样本进行标注，将其分为非有毒和有毒两类，形成了葡萄牙语和英语两种语言的数据集。

特点

Toxic-Text 数据集的特点在于其语言的多样性，包含葡萄牙语和英语两种语言的数据。数据集的样本覆盖了从多个数据源收集的有毒和非有毒语言，具有较好的广泛性和代表性。此外，数据集在标注过程中由专业人员完成，确保了标注的质量和一致性。然而，该数据集的葡萄牙语子集相对较小，这可能限制了其在某些应用场景中的使用。

使用方法

使用 Toxic-Text 数据集时，用户可以通过 HuggingFace 的 load_dataset 函数加载整个数据集或其子集。数据集提供了 'english' 和 'portuguese' 两种语言的数据分割，方便用户根据需要选择。在加载数据后，用户可以进行模型训练、数据分析和各种文本分类任务，如毒性检测、奖励/偏好模型训练或DPO微调等。

背景与挑战

背景概述

nicholasKluge/toxic-text数据集是由 Nicholas Kluge Corrêa 作为其博士论文的一部分而开发的，旨在探讨动态规范性的必要和充分条件以实现价值对齐。该数据集的创建受到了CNPq、FAPERGS和DAAD的资助，并与PUCRS哲学系和波恩大学的研究项目相关联。数据集包含葡萄牙语和英语两种语言的毒性和非毒性语言示例，主要来源于多个相关数据集的样本收集与整合，如Anthropic/hh-rlhf、allenai/prosocial-dialog等。该数据集的构建旨在服务于文本分类任务，尤其是毒性检测领域，具有重要的研究价值和社会影响力。

当前挑战

该数据集在构建过程中面临的挑战包括：确保数据样本的质量和代表性，处理毒性和冒犯性语言可能对使用者造成的心理影响，以及数据集中存在的潜在偏见。此外，葡萄牙语子集的数据量相比英语版本较少，这可能导致模型在葡萄牙语上的性能不如英语。数据集的使用者需要考虑到这些挑战，并在研究和应用中谨慎处理相关伦理和社会问题。

常用场景

经典使用场景

在文本分类领域，nicholasKluge/toxic-text数据集被广泛用于训练模型以识别和分类有毒与非有毒文本。该数据集包含葡萄牙语和英语两种语言的文本样本，为研究人员提供了一种评估自然语言处理模型在毒性检测方面的性能的可靠手段。

衍生相关工作

基于nicholasKluge/toxic-text数据集，已经衍生出一系列相关研究工作，包括对毒性语言的深度分析、模型性能的比较研究以及跨语言毒性检测的探索，这些工作进一步推动了毒性文本识别技术的发展和应用。

数据集最近研究