five

GermEval 2021 - Toxic, Engaging, & Fact-Claiming Comments test set

收藏
OpenDataLab2026-05-31 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/GermEval_2021-Toxic_Engaging_and_etc
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是作为 GermEval 2021 竞赛的一部分提供的,用于识别有毒、引人入胜和声称事实的评论。总计:4188 条匿名和带注释的德国 Facebook 评论 训练集:3244 条评论来自 2019 年 1 月至 2019 年 7 月期间德国政治脱口秀的 Facebook 页面 测试集:944 条评论来自 9 月至 2019 年期间德国政治脱口秀的 Facebook 页面2020 年 12 月 数据在 Risch、Stoll、Wilms、Wiegand 进行了描述。 GermEval 2021 关于识别有毒、引人入胜和声称事实的评论的共享任务概述。 GermEval 2021 关于识别有毒、引人入胜和事实声明评论的共享任务的会议记录与 KONVENS 2021 同地,DOI 10.48415/2021/fhw5-x128

This dataset was provided as part of the GermEval 2021 shared task for identifying toxic, engaging, and fact-claiming comments. In total, it contains 4,188 anonymized and annotated German Facebook comments. Training set: 3,244 comments sourced from the Facebook pages of German political talk shows, collected between January and July 2019. Test set: 944 comments from the Facebook pages of German political talk shows, collected between September 2019 and December 2020. The dataset was described by Risch, Stoll, Wilms and Wiegand in *Overview of the GermEval 2021 Shared Task on Identifying Toxic, Engaging, and Fact-Claiming Comments*. The proceedings of the GermEval 2021 Shared Task on Identifying Toxic, Engaging, and Fact-Claiming Comments were co-located with KONVENS 2021, with DOI: 10.48415/2021/fhw5-x128
提供机构:
OpenDataLab
创建时间:
2022-05-23
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集源自GermEval 2021竞赛,旨在对德国Facebook上的政治脱口秀评论进行标注,以识别有毒、引人入胜和声称事实的内容。它包含4188条匿名评论,其中训练集3244条,测试集944条,由杜塞道夫大学于2021年发布。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作