ruanchaves/hatebr_por_Latn_to_glg_Latn

Name: ruanchaves/hatebr_por_Latn_to_glg_Latn
Creator: ruanchaves
Published: 2023-04-22 19:12:59
License: 暂无描述

Hugging Face2023-04-22 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/ruanchaves/hatebr_por_Latn_to_glg_Latn

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含Instagram评论，并标注了是否包含攻击性语言、攻击性等级、反犹太主义、对独裁的道歉、肥胖恐惧症、同性恋恐惧症、党派主义、种族主义、宗教不容忍、性别歧视、仇外心理、攻击性及非仇恨言论、非攻击性内容以及三位专家的仇恨言论判断。数据集分为训练集、验证集和测试集，分别包含4480、1120和1400个样本。

提供机构：

ruanchaves

原始信息汇总

数据集概述

数据集特征

instagram_comments：字符串类型
offensive_language：布尔类型
offensiveness_levels：整数类型（int32）
antisemitism：布尔类型
apology_for_the_dictatorship：布尔类型
fatphobia：布尔类型
homophobia：布尔类型
partyism：布尔类型
racism：布尔类型
religious_intolerance：布尔类型
sexism：布尔类型
xenophobia：布尔类型
offensive_&_non-hate_speech：布尔类型
non-offensive：布尔类型
specialist_1_hate_speech：布尔类型
specialist_2_hate_speech：布尔类型
specialist_3_hate_speech：布尔类型

数据集分割

训练集：
- 大小：366154字节
- 样本数：4480
验证集：
- 大小：82771字节
- 样本数：1120
测试集：
- 大小：98956字节
- 样本数：1400

数据集大小

下载大小：0字节
数据集总大小：547881字节