nayohan/APEACH
收藏Hugging Face2024-07-07 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/nayohan/APEACH
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如文本、用户年龄、用户性别、文本主题、类别、年龄和英文文本主题。数据集主要用于韩语的仇恨言论检测,旨在通过众包方式生成仇恨言论示例,并进行最小化的后标注。数据集包含一个训练集,大小为751331字节,包含3770个示例。数据集的下载大小为254089字节,总大小为751331字节。数据集的许可证为cc-by-sa-4.0,标签包括安全(safety)。
The dataset contains multiple features such as text, user age, user gender, text topic, class, age, and English text topic. It is primarily used for hate speech detection in Korean, aiming to generate hate speech examples through crowdsourcing with minimal post-labeling. The dataset includes a training set with a size of 751331 bytes, containing 3770 examples. The download size of the dataset is 254089 bytes, and the total size is 751331 bytes. The dataset is licensed under cc-by-sa-4.0 and tagged with safety.
提供机构:
nayohan
原始信息汇总
数据集概述
数据集信息
-
特征:
text: 文本数据,类型为stringuser_age: 用户年龄,类型为int64user_gender: 用户性别,类型为stringtext_topic: 文本主题,类型为stringclass: 类别,类型为stringage: 年龄,类型为int64text_topic_eng: 文本主题(英文),类型为string
-
分割:
train: 训练集,包含 3770 个样本,大小为 751331 字节
-
下载大小: 254089 字节
-
数据集大小: 751331 字节
配置
- 配置名称:
default- 数据文件:
train: 路径为data/train-*
- 数据文件:
其他信息
- 许可证:
cc-by-sa-4.0 - 语言: 韩语 (
ko) - 标签:
safety



