ISCA-IUB/GermanLanguageTwitterAntisemitism
收藏德语推特反犹太主义数据集
Gunther Jikeli, Sameer Karali, Daniel Miehling 和 Katharina Soemer {gjikeli, skarali, damieh, ksoemer}@iu.edu
描述
我们的数据集包含8,048条与犹太生活相关的德语推文,时间跨度为四年。数据集包括18个包含关键词“Juden”或“Israel”的推文样本。这些样本代表了在指定时间段内所有实时推文的代表性样本。每个样本由两名专家标注者使用一个可视化实时推文的标注平台进行标注。我们根据两名标注者的共识提供标注结果,并在讨论差异后达成一致(Jikeli et al. 2022: 3-6)。
总体而言,335条推文(4%)根据国际犹太人权组织(IHRA)的反犹太主义工作定义被标记为反犹太主义。2019年有1345条推文(17%),2020年有1364条推文(17%),2021年有2639条推文(33%),2022年有2700条推文(34%)。
约一半的推文,总计4,493条推文(56%)来自关键词“Juden”的查询,代表了从2019年1月至2022年12月的连续时间段:2019年有864条推文(19%),2020年有891条推文(20%),2021年有1364条推文(30%),2022年有1374条推文(31%)。其中,4493条推文中有148条(3%)来自“Juden”查询的推文被标记为反犹太主义。
另一部分推文,总计3,555条(44%)来自关键词“Israel”的查询。2019年有481条推文(14%),2020年有473条推文(13%),2021年有1275条推文(36%),2022年有1326条推文(37%)。在所有来自“Israel”查询的推文中,187条(5%)被标记为反犹太主义。
csv文件包含德语的变音符号和特殊字符(例如“ä”、“ü”、“ö”、“ß”),在用文本编辑器以外的工具打开时应予以考虑。



