five

CML-COVID: a COVID-19 Twitter dataset

收藏
Texas Data Repository2021-01-28 更新2026-04-16 收录
下载链接:
https://dataverse.tdl.org/citation?persistentId=doi:10.18738/T8/W1CHVU
下载链接
链接失效反馈
官方服务:
资源简介:
In this dataset, we present CML-COVID, a COVID-19 Twitter data set of 19,298,967 million tweets from 5,977,653 unique individuals collected between March 2020 and July 2020. The prefix to each filename is the search query used. The CML-COVID dataset is released in compliance with Twitter’s Terms & Conditions (T&C) which prohibit the verbatim release of full tweet text and API-derived data. Rather, we provide a list of tweet IDs that others can directly ‘hydrate’ using calls to the Twitter API. If you use the CML-COVID dataset, please cite this dataset to acknowledge your use of our data.

本研究构建并发布了CML-COVID数据集,该数据集为针对COVID-19的Twitter推文数据集,收录了2020年3月至2020年7月期间、来自5977653位独立用户的19,298,967百万条推文。每个文件名的前缀为所使用的搜索查询词。本CML-COVID数据集遵照Twitter服务条款(Terms & Conditions,简称T&C)发布,该条款禁止直接完整发布推文原文及通过API获取的衍生数据,因此我们仅提供推文ID列表,其他使用者可通过调用Twitter API直接完成数据补全(hydrate)。若您使用本CML-COVID数据集,请引用该数据集以说明您对本数据的使用情况。
提供机构:
University of Texas at Austin
创建时间:
2021-01-26
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作