LennardZuendorf/interpretor
收藏Hugging Face2023-10-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/LennardZuendorf/interpretor
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含动态生成的仇恨言论,经过处理可用于分类任务,例如使用BERT进行分类。数据集被分为训练集和测试集,分别包含约74k和8k条记录。数据字段包括id、text、label和label_text,其中label是二元标签,表示是否为仇恨言论。
该数据集包含动态生成的仇恨言论,经过处理可用于分类任务,例如使用BERT进行分类。数据集被分为训练集和测试集,分别包含约74k和8k条记录。数据字段包括id、text、label和label_text,其中label是二元标签,表示是否为仇恨言论。
提供机构:
LennardZuendorf
原始信息汇总
数据集概述
数据集特征
- id: 整数类型 (int64)
- text: 字符串类型 (string)
- label: 整数类型 (int64)
- label_text: 字符串类型 (string)
数据集分割
- 训练集 (train): 74,159个样本,总大小为12,150,228.415975923字节
- 测试集 (test): 8,240个样本,总大小为1,350,043.584024078字节
数据集大小
- 下载大小: 8,392,302字节
- 数据集总大小: 13,500,272字节
语言
- 英语 (en)
大小分类
- 10K<n<100K
标签
- 标签: 二进制标签,0表示非仇恨,1表示仇恨
- 标签文本: 标签的文本形式
许可证
- MIT许可证
注意事项
- 数据集包含不适用于所有观众的内容,涉及法律问题。



