five

COVID-19 Twitter Chatter Dataset

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/COVID-19_Twitter_Chatter_Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
由于 COVID-19 全球大流行的相关性,我们正在发布从 Twitter 流中获取的与 COVID-19 聊天相关的推文数据集。自我们第一次发布以来,我们从新合作者那里收到了额外的数据,使该资源能够增长到目前的规模。专门的数据收集从 3 月 11 日开始,每天产生超过 400 万条推文。我们添加了新合作者在 1 月 27 日至 3 月 27 日期间提供的其他数据,以提供额外的纵向覆盖。第 10 版添加了约 150 万条俄语推文,这些推文在 1 月 1 日至 5 月 8 日期间收集,由 Katya Artemova (NRU HSE) 和 Elena Tutubalina (KFU) 优雅地提供给我们。从版本 12 开始,我们在各自的 zip 文件中包含了每日主题标签、提及和表情符号及其频率。

Given the global public health relevance of the COVID-19 pandemic, we are releasing a dataset of tweets related to COVID-19 conversations harvested from the Twitter stream. Since our first release, we have received additional data from new collaborators, allowing this resource to grow to its current scale. Specialized data collection began on March 11, generating over 4 million tweets per day. We have added supplementary data provided by new collaborators between January 27 and March 27 to provide additional longitudinal coverage. Version 10 added approximately 1.5 million Russian tweets collected between January 1 and May 8, graciously provided to us by Katya Artemova (NRU HSE) and Elena Tutubalina (KFU). Starting with Version 12, we have included daily hashtags, mentions, emojis and their frequencies in their respective zip files.
提供机构:
OpenDataLab
创建时间:
2022-05-23
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个从Twitter流中获取的与COVID-19聊天相关的推文集合,自2020年3月11日开始专门收集,每天产生超过400万条推文,并包含其他合作者提供的额外数据,如俄语推文和每日主题标签、提及和表情符号频率。它由多个研究机构联合发布,旨在支持开放科学研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作