OLID (Offensive Language Identification Dataset)
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/OLID
下载链接
链接失效反馈官方服务:
资源简介:
OLID 是一个分层数据集,用于识别社交媒体中攻击性文本的类型和目标。该数据集在 Twitter 上收集并公开提供。总共有 14100 条推文,其中 13240 条在训练集中,860 条在测试集中。对于每条推文,标签分为三个级别:(A)攻击性/非攻击性,(B)有针对性的侮辱/无针对性,(C)个人/团体/其他。它们之间的关系是分层的。如果一条推文具有攻击性,它可以有目标,也可以没有目标。如果对特定目标具有攻击性,则目标可以是个人、群体或其他一些对象。该数据集用于 SemEval-2019 的 OffensEval-2019 竞赛。
提供机构:
OpenDataLab
创建时间:
2022-08-19



