five

AiresPucrs/toxic-comments

收藏
Hugging Face2025-02-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/AiresPucrs/toxic-comments
下载链接
链接失效反馈
官方服务:
资源简介:
Toxic-comments数据集是Teeny-Tiny Castle教程的一部分,用于AI伦理和安全研究。该数据集包含有毒和仇恨评论,适用于文本分类任务,规模在10K到100K条数据之间。

The Toxic-comments dataset is part of the Teeny-Tiny Castle tutorial, used for AI Ethics and Safety research. It contains toxic and hate comments, suitable for text classification tasks, with a size ranging from 10K to 100K entries.
提供机构:
AiresPucrs
原始信息汇总

数据集概述

数据集名称

  • Toxic-Content Dataset

语言

  • 英语

数据集大小

  • 超过70,157个示例

内容结构

  • non_toxic_response: 被评估为非毒性的文本。
  • toxic_response: 被评估为毒性的文本。

数据集用途

  • 主要用于教育环境中,帮助检测文本内容中的毒性并识别潜在的有害语言。

使用案例

  • 用于训练模型以检测有害/毒性文本。

许可证

  • Apache License, Version 2.0
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作