five

Twitter Stance Election 2020

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Twitter_Stance_Election_2020
下载链接
链接失效反馈
官方服务:
资源简介:
数据集包含2500个手动标记的推文,1250每个候选人 (乔·拜登和唐纳德·特朗普)。这些推文是从我们的研究团队收集的与2020年美国总统选举相关的英语推文的未贴标签集中采样的。通过Twitter流API,我们使用与选举相关的主题标签和关键字收集数据。在2020年1月和2020年9月之间,我们收集了500万多条推文,不包括报价和转发。这些未标记的推文被用来微调我们所有的语言模型。我们公开提供的带标签的数据是从5m组中采样的,并使用Amazon Mechanical Turk进行了标记。

This dataset contains 2,500 manually labeled tweets, with 1,250 tweets for each candidate (Joe Biden and Donald Trump). These tweets were sampled from an unlabeled collection of English tweets related to the 2020 United States presidential election, collected by our research team. Data was gathered via the Twitter Streaming API using election-related hashtags and keywords. Between January 2020 and September 2020, we collected over 5 million tweets, excluding quote tweets and retweets. This unlabeled corpus was used to fine-tune all of our language models. The publicly released labeled data was sampled from this 5-million-tweet collection and annotated using Amazon Mechanical Turk.
提供机构:
OpenDataLab
创建时间:
2022-11-02
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Twitter Stance Election 2020数据集包含2500条手动标记的推文,聚焦2020年美国总统选举中的乔·拜登和唐纳德·特朗普两位候选人。这些数据从2020年1月至9月通过Twitter流API收集,原始未标记推文超过500万条,用于语言模型微调,标记工作通过Amazon Mechanical Turk完成。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作