five

SJ-Donald/kor-hate-sentence

收藏
Hugging Face2024-01-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/SJ-Donald/kor-hate-sentence
下载链接
链接失效反馈
官方服务:
资源简介:
SJ-Donald/kor-hate-sentence数据集是一个合并了多个韩语仇恨言论相关数据集的集合,包括smilegate-ai/kor_unsmile、korean-hate-speech、Curse-detection-data和korean-malicious-comments-dataset。合并后的数据集去除了重复项,包含训练集和测试集,分别有29328和7333行数据。每个数据样本包含문장(句子)、hate(仇恨)、clean(干净)和labels(标签)四个特征。

The SJ-Donald/kor-hate-sentence dataset is a consolidated collection of multiple Korean hate speech-related datasets, encompassing smilegate-ai/kor_unsmile, korean-hate-speech, Curse-detection-data, and korean-malicious-comments-dataset. After removing duplicate entries, the consolidated dataset is split into a training set and a test set, with 29,328 and 7,333 rows of data respectively. Each data sample comprises four features: Sentence, hate, clean, and labels.
提供机构:
SJ-Donald
原始信息汇总

SJ-Donald/kor-hate-sentence

数据集概述

SJ-Donald/kor-hate-sentence 是一个合并的数据集,来源于以下数据集:

该数据集通过合并上述数据集并去除重复项得到。

数据集结构

数据集包含训练集和测试集:

  • 训练集:包含29328条数据,特征包括[문장, hate, clean, labels]。
  • 测试集:包含7333条数据,特征包括[문장, hate, clean, labels]。

使用方法

Python from datasets import load_dataset

ds = load_dataset("SJ-Donald/kor-hate-sentence") print(ds)

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作