SJ-Donald/kor-hate-sentence
收藏Hugging Face2024-01-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/SJ-Donald/kor-hate-sentence
下载链接
链接失效反馈官方服务:
资源简介:
SJ-Donald/kor-hate-sentence数据集是一个合并了多个韩语仇恨言论相关数据集的集合,包括smilegate-ai/kor_unsmile、korean-hate-speech、Curse-detection-data和korean-malicious-comments-dataset。合并后的数据集去除了重复项,包含训练集和测试集,分别有29328和7333行数据。每个数据样本包含문장(句子)、hate(仇恨)、clean(干净)和labels(标签)四个特征。
The SJ-Donald/kor-hate-sentence dataset is a consolidated collection of multiple Korean hate speech-related datasets, encompassing smilegate-ai/kor_unsmile, korean-hate-speech, Curse-detection-data, and korean-malicious-comments-dataset. After removing duplicate entries, the consolidated dataset is split into a training set and a test set, with 29,328 and 7,333 rows of data respectively. Each data sample comprises four features: Sentence, hate, clean, and labels.
提供机构:
SJ-Donald
原始信息汇总
SJ-Donald/kor-hate-sentence
数据集概述
SJ-Donald/kor-hate-sentence 是一个合并的数据集,来源于以下数据集:
该数据集通过合并上述数据集并去除重复项得到。
数据集结构
数据集包含训练集和测试集:
- 训练集:包含29328条数据,特征包括[문장, hate, clean, labels]。
- 测试集:包含7333条数据,特征包括[문장, hate, clean, labels]。
使用方法
Python from datasets import load_dataset
ds = load_dataset("SJ-Donald/kor-hate-sentence") print(ds)



