Twitter Stance Election 2020
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Twitter_Stance_Election_2020
下载链接
链接失效反馈官方服务:
资源简介:
数据集包含2500个手动标记的推文,1250每个候选人 (乔·拜登和唐纳德·特朗普)。这些推文是从我们的研究团队收集的与2020年美国总统选举相关的英语推文的未贴标签集中采样的。通过Twitter流API,我们使用与选举相关的主题标签和关键字收集数据。在2020年1月和2020年9月之间,我们收集了500万多条推文,不包括报价和转发。这些未标记的推文被用来微调我们所有的语言模型。我们公开提供的带标签的数据是从5m组中采样的,并使用Amazon Mechanical Turk进行了标记。
This dataset contains 2,500 manually labeled tweets, with 1,250 tweets for each candidate (Joe Biden and Donald Trump). These tweets were sampled from an unlabeled collection of English tweets related to the 2020 United States presidential election, collected by our research team. Data was gathered via the Twitter Streaming API using election-related hashtags and keywords. Between January 2020 and September 2020, we collected over 5 million tweets, excluding quote tweets and retweets. This unlabeled corpus was used to fine-tune all of our language models. The publicly released labeled data was sampled from this 5-million-tweet collection and annotated using Amazon Mechanical Turk.
提供机构:
OpenDataLab
创建时间:
2022-11-02
搜集汇总
数据集介绍

背景与挑战
背景概述
Twitter Stance Election 2020数据集包含2500条手动标记的推文,聚焦2020年美国总统选举中的乔·拜登和唐纳德·特朗普两位候选人。这些数据从2020年1月至9月通过Twitter流API收集,原始未标记推文超过500万条,用于语言模型微调,标记工作通过Amazon Mechanical Turk完成。
以上内容由遇见数据集搜集并总结生成



