five

Brandon-h/offensive-and-grooming-dataset

收藏
Hugging Face2023-12-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Brandon-h/offensive-and-grooming-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了来自offendES数据集的元素和来自sexismreddit数据集的英文到西班牙语的翻译。其目的是为能够识别对儿童有害文本的模型提供训练数据。id2label字典如下:0表示针对个人的攻击性信息,1表示针对群体或社区的攻击性信息,2表示非攻击性文本,3表示非攻击性但明确的文本,4表示可能的诱骗或在线性骚扰。

该数据集包含了来自offendES数据集的元素和来自sexismreddit数据集的英文到西班牙语的翻译。其目的是为能够识别对儿童有害文本的模型提供训练数据。id2label字典如下:0表示针对个人的攻击性信息,1表示针对群体或社区的攻击性信息,2表示非攻击性文本,3表示非攻击性但明确的文本,4表示可能的诱骗或在线性骚扰。
提供机构:
Brandon-h
原始信息汇总

数据集描述

该数据集包含来自offendES数据集的元素以及从sexismreddit数据集从英语到西班牙语的翻译。该数据集旨在为能够识别对儿童有害文本的模型提供训练数据。

数据集的id2label字典如下:

id2label = {0:"OFP", 1:"OFG", 2:"NO", 3:"NOE", 4:"GP"}

其中,OFP代表针对单个人的冒犯性信息,OFG代表针对群体或社区的冒犯性信息,NO代表非冒犯性文本,NOE代表非冒犯性但明确的文本,GP代表可能的网络性骚扰或对收件人的在线性侵犯。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作