ruanchaves/hatebr_por_Latn_to_glg_Latn
收藏Hugging Face2023-04-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ruanchaves/hatebr_por_Latn_to_glg_Latn
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含Instagram评论,并标注了是否包含攻击性语言、攻击性等级、反犹太主义、对独裁的道歉、肥胖恐惧症、同性恋恐惧症、党派主义、种族主义、宗教不容忍、性别歧视、仇外心理、攻击性及非仇恨言论、非攻击性内容以及三位专家的仇恨言论判断。数据集分为训练集、验证集和测试集,分别包含4480、1120和1400个样本。
该数据集包含Instagram评论,并标注了是否包含攻击性语言、攻击性等级、反犹太主义、对独裁的道歉、肥胖恐惧症、同性恋恐惧症、党派主义、种族主义、宗教不容忍、性别歧视、仇外心理、攻击性及非仇恨言论、非攻击性内容以及三位专家的仇恨言论判断。数据集分为训练集、验证集和测试集,分别包含4480、1120和1400个样本。
提供机构:
ruanchaves
原始信息汇总
数据集概述
数据集特征
- instagram_comments:字符串类型
- offensive_language:布尔类型
- offensiveness_levels:整数类型(int32)
- antisemitism:布尔类型
- apology_for_the_dictatorship:布尔类型
- fatphobia:布尔类型
- homophobia:布尔类型
- partyism:布尔类型
- racism:布尔类型
- religious_intolerance:布尔类型
- sexism:布尔类型
- xenophobia:布尔类型
- offensive_&_non-hate_speech:布尔类型
- non-offensive:布尔类型
- specialist_1_hate_speech:布尔类型
- specialist_2_hate_speech:布尔类型
- specialist_3_hate_speech:布尔类型
数据集分割
- 训练集:
- 大小:366154字节
- 样本数:4480
- 验证集:
- 大小:82771字节
- 样本数:1120
- 测试集:
- 大小:98956字节
- 样本数:1400
数据集大小
- 下载大小:0字节
- 数据集总大小:547881字节



