five

ISCA-IUB/GermanLanguageTwitterAntisemitism

收藏
Hugging Face2023-11-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ISCA-IUB/GermanLanguageTwitterAntisemitism
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含8048条与犹太生活相关的德语推特,时间跨度为四年。这些推特是通过关键词“Juden”或“Israel”收集的,并且每条推特都由两位专家注释者进行标注。数据集中的335条推特(4%)被标记为反犹太主义。推特在不同年份的分布情况如下:2019年1345条(17%),2020年1364条(17%),2021年2639条(33%),2022年2700条(34%)。其中,4493条推特(56%)是通过关键词“Juden”收集的,3555条推特(44%)是通过关键词“Israel”收集的。在“Juden”相关的推特中,148条(3%)被标记为反犹太主义;在“Israel”相关的推特中,187条(5%)被标记为反犹太主义。数据集以CSV文件形式提供,包含德语的特殊字符。
提供机构:
ISCA-IUB
原始信息汇总

德语推特反犹太主义数据集

Gunther Jikeli, Sameer Karali, Daniel Miehling 和 Katharina Soemer {gjikeli, skarali, damieh, ksoemer}@iu.edu

描述

我们的数据集包含8,048条与犹太生活相关的德语推文,时间跨度为四年。数据集包括18个包含关键词“Juden”或“Israel”的推文样本。这些样本代表了在指定时间段内所有实时推文的代表性样本。每个样本由两名专家标注者使用一个可视化实时推文的标注平台进行标注。我们根据两名标注者的共识提供标注结果,并在讨论差异后达成一致(Jikeli et al. 2022: 3-6)。

总体而言,335条推文(4%)根据国际犹太人权组织(IHRA)的反犹太主义工作定义被标记为反犹太主义。2019年有1345条推文(17%),2020年有1364条推文(17%),2021年有2639条推文(33%),2022年有2700条推文(34%)。

约一半的推文,总计4,493条推文(56%)来自关键词“Juden”的查询,代表了从2019年1月至2022年12月的连续时间段:2019年有864条推文(19%),2020年有891条推文(20%),2021年有1364条推文(30%),2022年有1374条推文(31%)。其中,4493条推文中有148条(3%)来自“Juden”查询的推文被标记为反犹太主义。

另一部分推文,总计3,555条(44%)来自关键词“Israel”的查询。2019年有481条推文(14%),2020年有473条推文(13%),2021年有1275条推文(36%),2022年有1326条推文(37%)。在所有来自“Israel”查询的推文中,187条(5%)被标记为反犹太主义。

csv文件包含德语的变音符号和特殊字符(例如“ä”、“ü”、“ö”、“ß”),在用文本编辑器以外的工具打开时应予以考虑。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作