five

kmhas_korean_hate_speech

收藏
OpenCSG2024-07-19 更新2026-01-19 收录
下载链接:
https://opencsg.com/datasets/AIWizards/kmhas_korean_hate_speech?tab=summary
下载链接
链接失效反馈
官方服务:
资源简介:
K-MHaS仓库提供了一个用于韩语仇恨言论检测的数据集,它包含从韩国在线新闻评论中收集的109,692条文本数据,并标注了8个细粒度的仇恨言论类别(政治、出身、身体、年龄、性别、宗教、种族、辱骂)以及“非仇恨言论”类别。每条文本可能包含一个到四个标签,以有效处理韩语的语言模式。该数据集支持仇恨言论检测任务,包括二元分类和多标签分类,并采用CC-BY-SA 4.0许可协议。

The K-MHaS repository provides a dataset for Korean hate speech detection. It contains 109,692 textual instances collected from South Korean online news comments, annotated with 8 fine-grained hate speech categories (politics, origin, physical, age, gender, religion, race, and profanity) as well as the "non-hate speech" category. Each text may carry 1 to 4 labels to effectively accommodate Korean linguistic patterns. This dataset supports hate speech detection tasks including binary classification and multi-label classification, and is released under the CC-BY-SA 4.0 license.
提供机构:
AIWizards
创建时间:
2024-07-19
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作