five

stefan-it/offenseval2020_tr

收藏
Hugging Face2024-11-22 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/stefan-it/offenseval2020_tr
下载链接
链接失效反馈
官方服务:
资源简介:
OffensEval-TR 2020数据集是一个特殊版本,用于识别土耳其语中的冒犯性语言。该版本将官方训练数据集分为较小的训练数据集(30,000条标注推文)和开发集(1,756条标注推文),测试集保持不变,包含3,528条推文。推文中的用户提及被替换为`@USER`,URL被替换为`URL`。每个实例包含一个标签,对应于子任务A:冒犯性语言识别。

The OffensEval-TR 2020 dataset is a special version of a well-known dataset used for identifying offensive language in Turkish. The original training dataset contains 31,756 annotated tweets, which this version splits into 30,000 training tweets and 1,756 development tweets. The test dataset remains unmodified with 3,528 tweets. The dataset supports tasks such as offensive language identification and is in Turkish.
提供机构:
stefan-it
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作