COVID-19_Twitter_Chatter_Dataset
收藏魔搭社区2025-11-19 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/COVID-19_Twitter_Chatter_Dataset
下载链接
链接失效反馈官方服务:
资源简介:
displayName: COVID-19 Twitter Chatter Dataset
labelTypes:
- Text
license:
- COVID-19_Twitter_Chatter_Dataset Custom
mediaTypes:
- Text
paperUrl: https://arxiv.org/pdf/2004.03688v2.pdf
publishDate: "2020-06-21"
publishUrl: https://zenodo.org/record/3902855
publisher:
- Georgia State University
- University of Missouri
- Universitat Autònoma de Barcelona
- Carl von Ossietzky Universität Oldenburg
- Universität Duisburg-Essen
- Kazan Federal University
- National Research University Higher School of Economics
tags:
- Twitter
- COVID-19
taskTypes:
- Text Classification
---
# 数据集介绍
## 简介
由于 COVID-19 全球大流行的相关性,我们正在发布从 Twitter 流中获取的与 COVID-19 聊天相关的推文数据集。自我们第一次发布以来,我们从新合作者那里收到了额外的数据,使该资源能够增长到目前的规模。专门的数据收集从 3 月 11 日开始,每天产生超过 400 万条推文。我们添加了新合作者在 1 月 27 日至 3 月 27 日期间提供的其他数据,以提供额外的纵向覆盖。第 10 版添加了约 150 万条俄语推文,这些推文在 1 月 1 日至 5 月 8 日期间收集,由 Katya Artemova (NRU HSE) 和 Elena Tutubalina (KFU) 优雅地提供给我们。从版本 12 开始,我们在各自的 zip 文件中包含了每日主题标签、提及和表情符号及其频率。
## 引文
```
@article{banda2021large,
title={A large-scale COVID-19 Twitter chatter dataset for open scientific research—an international collaboration},
author={Banda, Juan M and Tekumalla, Ramya and Wang, Guanyu and Yu, Jingyuan and Liu, Tuo and Ding, Yuning and Artemova, Ekaterina and Tutubalina, Elena and Chowell, Gerardo},
journal={Epidemiologia},
volume={2},
number={3},
pages={315--324},
year={2021},
publisher={Multidisciplinary Digital Publishing Institute}
}
```
## Download dataset
:modelscope-code[]{type="git"}
显示名称:COVID-19 Twitter 聊天数据集(COVID-19 Twitter Chatter Dataset)
labelTypes:
- 文本(Text)
license:
- COVID-19_Twitter_Chatter_Dataset 自定义许可证
mediaTypes:
- 文本(Text)
paperUrl: https://arxiv.org/pdf/2004.03688v2.pdf
publishDate: "2020-06-21"
publishUrl: https://zenodo.org/record/3902855
publisher:
- 佐治亚州立大学
- 密苏里大学
- 巴塞罗那自治大学
- 奥尔登堡卡尔·冯·奥西茨基大学
- 杜伊斯堡-埃森大学
- 喀山联邦大学
- 国立研究型高等经济大学
tags:
- Twitter
- COVID-19
taskTypes:
- 文本分类(Text Classification)
---
# 数据集介绍
## 简介
鉴于COVID-19全球大流行的公共卫生相关性,本团队发布从Twitter信息流中采集的、与新冠疫情相关的推特聊天数据集。自首次发布以来,我们新增了来自新合作方的数据,使该数据集资源规模得以扩充至当前体量。专项数据采集工作始于2020年3月11日,每日产出超400万条推文。此外,我们补充了新合作方在2020年1月27日至3月27日期间提供的额外数据,以增强数据集的纵向覆盖范围。第10版新增了约150万条俄语推文,这些数据采集于2020年1月1日至5月8日,由叶卡捷琳娜·阿尔捷莫娃(Ekaterina Artemova,NRU HSE,国立研究型高等经济大学)与叶莲娜·图图巴利娜(Elena Tutubalina,KFU,喀山联邦大学)慷慨提供。自第12版起,我们在各压缩包中附带了每日的主题标签、提及对象、表情符号及其出现频率。
## 引文
@article{banda2021large,
title={A large-scale COVID-19 Twitter chatter dataset for open scientific research—an international collaboration},
author={Banda, Juan M and Tekumalla, Ramya and Wang, Guanyu and Yu, Jingyuan and Liu, Tuo and Ding, Yuning and Artemova, Ekaterina and Tutubalina, Elena and Chowell, Gerardo},
journal={Epidemiologia},
volume={2},
number={3},
pages={315--324},
year={2021},
publisher={Multidisciplinary Digital Publishing Institute}
}
## 数据集下载
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-13



