APEACH
收藏arXiv2022-10-26 更新2024-06-21 收录
下载链接:
https://huggingface.co/datasets/jason9693/APEACH
下载链接
链接失效反馈官方服务:
资源简介:
APEACH数据集是由Kakao Corp.等机构合作创建的,专注于韩国仇恨言论检测。该数据集包含约3770条实例,涵盖了多样化的主题和句子长度,旨在通过用户生成的内容减少与预训练语料库的词汇重叠,从而更准确地评估模型性能。创建过程中,采用了匿名付费工作者生成有毒表达的方式,并通过任务管理器进行后标记,确保数据质量。APEACH数据集的应用领域主要集中在评估预训练语言模型在仇恨言论检测中的性能,特别是在减少训练与测试集之间的域重叠方面。
提供机构:
Kakao Corp. 2Kakao Enterprise Corp. 3School of Software, Soongsil University 4Dept. of ECE, Seoul National University
创建时间:
2022-02-25



