SJ-Donald/kor-hate-sentence

Name: SJ-Donald/kor-hate-sentence
Creator: SJ-Donald
Published: 2024-01-24 02:27:43
License: 暂无描述

Hugging Face2024-01-24 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/SJ-Donald/kor-hate-sentence

下载链接

链接失效反馈

官方服务：

资源简介：

SJ-Donald/kor-hate-sentence数据集是一个合并了多个韩语仇恨言论相关数据集的集合，包括smilegate-ai/kor_unsmile、korean-hate-speech、Curse-detection-data和korean-malicious-comments-dataset。合并后的数据集去除了重复项，包含训练集和测试集，分别有29328和7333行数据。每个数据样本包含문장（句子）、hate（仇恨）、clean（干净）和labels（标签）四个特征。

The SJ-Donald/kor-hate-sentence dataset is a consolidated collection of multiple Korean hate speech-related datasets, encompassing smilegate-ai/kor_unsmile, korean-hate-speech, Curse-detection-data, and korean-malicious-comments-dataset. After removing duplicate entries, the consolidated dataset is split into a training set and a test set, with 29,328 and 7,333 rows of data respectively. Each data sample comprises four features: Sentence, hate, clean, and labels.

提供机构：

SJ-Donald

原始信息汇总

SJ-Donald/kor-hate-sentence

数据集概述

SJ-Donald/kor-hate-sentence 是一个合并的数据集，来源于以下数据集：

该数据集通过合并上述数据集并去除重复项得到。

数据集结构

数据集包含训练集和测试集：

训练集：包含29328条数据，特征包括[문장, hate, clean, labels]。
测试集：包含7333条数据，特征包括[문장, hate, clean, labels]。

使用方法

Python from datasets import load_dataset

ds = load_dataset("SJ-Donald/kor-hate-sentence") print(ds)

5,000+

优质数据集

54 个

任务类型

进入经典数据集