Lots-of-LoRAs/task905_hate_speech_offensive_classification
收藏Hugging Face2024-07-16 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/Lots-of-LoRAs/task905_hate_speech_offensive_classification
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个用于仇恨言论和冒犯性语言分类的文本生成任务数据集。数据集包含5200个训练样本、650个验证样本和650个测试样本。数据集的创建者是通过众包方式完成的,语言为英语,许可证为Apache-2.0。数据集的特征包括输入文本、输出文本和ID。数据集的主页和相关论文提供了更多详细信息。
This dataset is a text-generation task dataset for hate speech and offensive language classification. The dataset contains 5200 training examples, 650 validation examples, and 650 test examples. The dataset was created through crowdsourcing, is in English, and is licensed under Apache-2.0. The features of the dataset include input text, output text, and ID. The datasets homepage and related papers provide more detailed information.
提供机构:
Lots-of-LoRAs
原始信息汇总
数据集概述
基本信息
- 数据集名称: task905_hate_speech_offensive_classification
- 任务类别: 文本生成
- 语言: 英语
- 许可证: Apache 2.0
- 语言创建者: 众包
- 注释创建者: 众包
数据集结构
- 配置名称: plain_text
- 特征:
- input: 字符串类型
- output: 字符串类型
- id: 字符串类型
数据分割
- 训练集: 5200个样本
- 验证集: 650个样本
- 测试集: 650个样本



