five

OLID (Offensive Language Identification Dataset)

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/OLID
下载链接
链接失效反馈
官方服务:
资源简介:
OLID 是一个分层数据集,用于识别社交媒体中攻击性文本的类型和目标。该数据集在 Twitter 上收集并公开提供。总共有 14100 条推文,其中 13240 条在训练集中,860 条在测试集中。对于每条推文,标签分为三个级别:(A)攻击性/非攻击性,(B)有针对性的侮辱/无针对性,(C)个人/团体/其他。它们之间的关系是分层的。如果一条推文具有攻击性,它可以有目标,也可以没有目标。如果对特定目标具有攻击性,则目标可以是个人、群体或其他一些对象。该数据集用于 SemEval-2019 的 OffensEval-2019 竞赛。
提供机构:
OpenDataLab
创建时间:
2022-08-19
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作