five

ruanchaves/hatebr_por_Latn_to_glg_Latn

收藏
Hugging Face2023-04-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ruanchaves/hatebr_por_Latn_to_glg_Latn
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含Instagram评论,并标注了是否包含攻击性语言、攻击性等级、反犹太主义、对独裁的道歉、肥胖恐惧症、同性恋恐惧症、党派主义、种族主义、宗教不容忍、性别歧视、仇外心理、攻击性及非仇恨言论、非攻击性内容以及三位专家的仇恨言论判断。数据集分为训练集、验证集和测试集,分别包含4480、1120和1400个样本。

该数据集包含Instagram评论,并标注了是否包含攻击性语言、攻击性等级、反犹太主义、对独裁的道歉、肥胖恐惧症、同性恋恐惧症、党派主义、种族主义、宗教不容忍、性别歧视、仇外心理、攻击性及非仇恨言论、非攻击性内容以及三位专家的仇恨言论判断。数据集分为训练集、验证集和测试集,分别包含4480、1120和1400个样本。
提供机构:
ruanchaves
原始信息汇总

数据集概述

数据集特征

  • instagram_comments:字符串类型
  • offensive_language:布尔类型
  • offensiveness_levels:整数类型(int32)
  • antisemitism:布尔类型
  • apology_for_the_dictatorship:布尔类型
  • fatphobia:布尔类型
  • homophobia:布尔类型
  • partyism:布尔类型
  • racism:布尔类型
  • religious_intolerance:布尔类型
  • sexism:布尔类型
  • xenophobia:布尔类型
  • offensive_&_non-hate_speech:布尔类型
  • non-offensive:布尔类型
  • specialist_1_hate_speech:布尔类型
  • specialist_2_hate_speech:布尔类型
  • specialist_3_hate_speech:布尔类型

数据集分割

  • 训练集
    • 大小:366154字节
    • 样本数:4480
  • 验证集
    • 大小:82771字节
    • 样本数:1120
  • 测试集
    • 大小:98956字节
    • 样本数:1400

数据集大小

  • 下载大小:0字节
  • 数据集总大小:547881字节
二维码
社区交流群
二维码
科研交流群
商业服务