five

vpmoreira/offcombr

收藏
Hugging Face2024-01-18 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/vpmoreira/offcombr
下载链接
链接失效反馈
官方服务:
资源简介:
OffComBR是一个用于检测巴西网络新闻评论中仇恨言论的注释数据集,包含葡萄牙语的文本和标签(no和yes)。数据集有两个配置(offcombr-2和offcombr-3),每个配置都有训练集,分别包含1250和1033个样本。

OffComBR是一个用于检测巴西网络新闻评论中仇恨言论的注释数据集,包含葡萄牙语的文本和标签(no和yes)。数据集有两个配置(offcombr-2和offcombr-3),每个配置都有训练集,分别包含1250和1033个样本。
提供机构:
vpmoreira
原始信息汇总

数据集概述

  • 名称: Offensive Comments in the Brazilian Web
  • 别名: OffComBR
  • 语言: 葡萄牙语 (pt)
  • 许可证: 未知
  • 多语言性: 单语种
  • 大小: 1K<n<10K
  • 源数据: 原始数据
  • 任务类别: 文本分类
  • 标签: 仇恨言论检测

数据集结构

配置信息

  • config_name: offcombr-2
    • 特征:
      • label: 类别标签,值为no或yes
      • text: 文本数据,类型为字符串
    • 分割:
      • train: 1250个样本,数据大小为105703字节,下载大小为99956字节
  • config_name: offcombr-3
    • 特征:
      • label: 类别标签,值为no或yes
      • text: 文本数据,类型为字符串
    • 分割:
      • train: 1033个样本,数据大小为90094字节,下载大小为85215字节

数据集创建

  • 注释创建者: 专家生成
  • 语言创建者: 发现
  • 注释:
    • 注释过程、注释者信息未提供
  • 个人和敏感信息: 信息未提供
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作