vpmoreira/offcombr
收藏Hugging Face2024-01-18 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/vpmoreira/offcombr
下载链接
链接失效反馈官方服务:
资源简介:
OffComBR是一个用于检测巴西网络新闻评论中仇恨言论的注释数据集,包含葡萄牙语的文本和标签(no和yes)。数据集有两个配置(offcombr-2和offcombr-3),每个配置都有训练集,分别包含1250和1033个样本。
OffComBR是一个用于检测巴西网络新闻评论中仇恨言论的注释数据集,包含葡萄牙语的文本和标签(no和yes)。数据集有两个配置(offcombr-2和offcombr-3),每个配置都有训练集,分别包含1250和1033个样本。
提供机构:
vpmoreira
原始信息汇总
数据集概述
- 名称: Offensive Comments in the Brazilian Web
- 别名: OffComBR
- 语言: 葡萄牙语 (pt)
- 许可证: 未知
- 多语言性: 单语种
- 大小: 1K<n<10K
- 源数据: 原始数据
- 任务类别: 文本分类
- 标签: 仇恨言论检测
数据集结构
配置信息
- config_name: offcombr-2
- 特征:
- label: 类别标签,值为no或yes
- text: 文本数据,类型为字符串
- 分割:
- train: 1250个样本,数据大小为105703字节,下载大小为99956字节
- 特征:
- config_name: offcombr-3
- 特征:
- label: 类别标签,值为no或yes
- text: 文本数据,类型为字符串
- 分割:
- train: 1033个样本,数据大小为90094字节,下载大小为85215字节
- 特征:
数据集创建
- 注释创建者: 专家生成
- 语言创建者: 发现
- 注释:
- 注释过程、注释者信息未提供
- 个人和敏感信息: 信息未提供



