five

COVID-19_Twitter_Chatter_Dataset

收藏
魔搭社区2025-11-19 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/COVID-19_Twitter_Chatter_Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
displayName: COVID-19 Twitter Chatter Dataset labelTypes: - Text license: - COVID-19_Twitter_Chatter_Dataset Custom mediaTypes: - Text paperUrl: https://arxiv.org/pdf/2004.03688v2.pdf publishDate: "2020-06-21" publishUrl: https://zenodo.org/record/3902855 publisher: - Georgia State University - University of Missouri - Universitat Autònoma de Barcelona - Carl von Ossietzky Universität Oldenburg - Universität Duisburg-Essen - Kazan Federal University - National Research University Higher School of Economics tags: - Twitter - COVID-19 taskTypes: - Text Classification --- # 数据集介绍 ## 简介 由于 COVID-19 全球大流行的相关性,我们正在发布从 Twitter 流中获取的与 COVID-19 聊天相关的推文数据集。自我们第一次发布以来,我们从新合作者那里收到了额外的数据,使该资源能够增长到目前的规模。专门的数据收集从 3 月 11 日开始,每天产生超过 400 万条推文。我们添加了新合作者在 1 月 27 日至 3 月 27 日期间提供的其他数据,以提供额外的纵向覆盖。第 10 版添加了约 150 万条俄语推文,这些推文在 1 月 1 日至 5 月 8 日期间收集,由 Katya Artemova (NRU HSE) 和 Elena Tutubalina (KFU) 优雅地提供给我们。从版本 12 开始,我们在各自的 zip 文件中包含了每日主题标签、提及和表情符号及其频率。 ## 引文 ``` @article{banda2021large, title={A large-scale COVID-19 Twitter chatter dataset for open scientific research—an international collaboration}, author={Banda, Juan M and Tekumalla, Ramya and Wang, Guanyu and Yu, Jingyuan and Liu, Tuo and Ding, Yuning and Artemova, Ekaterina and Tutubalina, Elena and Chowell, Gerardo}, journal={Epidemiologia}, volume={2}, number={3}, pages={315--324}, year={2021}, publisher={Multidisciplinary Digital Publishing Institute} } ``` ## Download dataset :modelscope-code[]{type="git"}

显示名称:COVID-19 Twitter 聊天数据集(COVID-19 Twitter Chatter Dataset) labelTypes: - 文本(Text) license: - COVID-19_Twitter_Chatter_Dataset 自定义许可证 mediaTypes: - 文本(Text) paperUrl: https://arxiv.org/pdf/2004.03688v2.pdf publishDate: "2020-06-21" publishUrl: https://zenodo.org/record/3902855 publisher: - 佐治亚州立大学 - 密苏里大学 - 巴塞罗那自治大学 - 奥尔登堡卡尔·冯·奥西茨基大学 - 杜伊斯堡-埃森大学 - 喀山联邦大学 - 国立研究型高等经济大学 tags: - Twitter - COVID-19 taskTypes: - 文本分类(Text Classification) --- # 数据集介绍 ## 简介 鉴于COVID-19全球大流行的公共卫生相关性,本团队发布从Twitter信息流中采集的、与新冠疫情相关的推特聊天数据集。自首次发布以来,我们新增了来自新合作方的数据,使该数据集资源规模得以扩充至当前体量。专项数据采集工作始于2020年3月11日,每日产出超400万条推文。此外,我们补充了新合作方在2020年1月27日至3月27日期间提供的额外数据,以增强数据集的纵向覆盖范围。第10版新增了约150万条俄语推文,这些数据采集于2020年1月1日至5月8日,由叶卡捷琳娜·阿尔捷莫娃(Ekaterina Artemova,NRU HSE,国立研究型高等经济大学)与叶莲娜·图图巴利娜(Elena Tutubalina,KFU,喀山联邦大学)慷慨提供。自第12版起,我们在各压缩包中附带了每日的主题标签、提及对象、表情符号及其出现频率。 ## 引文 @article{banda2021large, title={A large-scale COVID-19 Twitter chatter dataset for open scientific research—an international collaboration}, author={Banda, Juan M and Tekumalla, Ramya and Wang, Guanyu and Yu, Jingyuan and Liu, Tuo and Ding, Yuning and Artemova, Ekaterina and Tutubalina, Elena and Chowell, Gerardo}, journal={Epidemiologia}, volume={2}, number={3}, pages={315--324}, year={2021}, publisher={Multidisciplinary Digital Publishing Institute} } ## 数据集下载 :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-13
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作