five

MetaCOVID

收藏
github2023-04-09 更新2024-05-31 收录
下载链接:
https://github.com/bigheiniu/awesome-coronavirus19-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个由亚利桑那州立大学DMML实验室维护的COVID-19相关数据集仓库,包含多种学术、新闻和社交媒体资源。

This is a COVID-19-related dataset repository maintained by the DMML Lab at Arizona State University, which encompasses a wide range of academic, news and social media resources.
创建时间:
2020-03-22
原始信息汇总

MetaCOVID 数据集概述

学术资源

预印本

  • covid-19-social-science-research: 跟踪关于 COVID-19 的新社会研究的资源,包括已发表的发现、预印本、正在进行中的项目和至少达到坚实提案阶段的项目。
  • CORD-19: 包含超过 44,000 篇关于 COVID-19、SARS-CoV-2 及相关冠状病毒的学术文章,其中超过 29,000 篇包含全文。

已发表

  • LitCovid: 一个 curated 的文献中心,用于跟踪关于 2019 年新型冠状病毒的最新科学信息。

新闻资源

事实核查

  • nCovMemory-en: 关于 2019-nCoV 疫情和中国新型冠状病毒肺炎(NCP)相关新闻报道的英文翻译库。
  • PoliticalFact fact checked: PolitiFact 对关于病毒的社交媒体帖子进行了大量事实核查,包括假的新冠病毒治疗方法、虚假新闻报道和关于传播的阴谋论。
  • Coronavirus Misinformation Tracking Center: 由 NewsGuard 发现并列出的在美国、英国、法国、意大利和德国发布关于病毒的实质性虚假信息的网站。
  • Malicious URLs: 由 NewsGuard 检查的恶意 URL 列表。
  • COVID-19 coronavirus news articles: 存档的 COVID-19 新冠病毒新闻文章数据库。
  • COVID-19 Television Coverage Dataset: 探索电视新闻上新冠病毒叙事的新数据集。

谣言

  • FEMA: 帮助公众区分关于新冠病毒(COVID-19)大流行响应的谣言和事实。
  • Defense Department: 由州和地方政府收集的事实和虚构信息。
  • UALR-Known Misinformation: 关于新冠病毒的已知错误信息。
  • #CoronaVirusFacts Alliance: 联合全球超过 100 个事实核查者发布、分享和翻译关于新冠病毒的事实。
  • covid19-misinfo-data: 包含 CDC、WHO 和 MedicalNewsToday 的科学事实核查声明以及 PolitiFact 的政治事实核查声明。

社交媒体

Twitter

  • COVID-19-TweetIDs: 包含自 2020 年 1 月 28 日以来与新冠病毒 COVID-19(SARS-CoV-2)相关的推文 ID 集合。
  • Coronavirus Tweet Ids: 包含 51,798,932 条与新冠病毒或 COVID-19 相关的推文 ID,收集于 2020 年 3 月 3 日至 3 月 19 日。
  • Crowdbreaks: 包含与特定健康主题相关的关键词推文,系统设计用于实时跟踪不同国家的健康和疾病相关问题趋势。
  • Covid-19: 自 2 月 11 日起,通过关键词过滤的推文(新冠病毒、2019nCoV 等),包含推文和转发。
  • COVID-19 Real World Worry Dataset: 测量 COVID-19 真实世界担忧数据集中的情绪。
  • COVID-19 Infodemic Twitter Dataset: 包含关于 COVID-19 的虚假信息相关推文,带有细粒度标签。
  • CoVaxxy: 关于 COVID-19 疫苗的英文推文集合。

地理空间

移动性

  • COVID-1- Mobility Monitoring project: 意大利的移动性数据,通过智能手机应用程序匿名收集。
  • Baidu Mobility Data: 从百度迁移网站抓取的数据。
  • Geographic Distribution of COVID-19 cases worldwide: 每日更新的全球 COVID-19 病例地理分布数据。
  • Apple Mobility Trends Reports: 国家/地区和城市的 COVID-19 移动趋势报告,每日发布。
  • Covid-19 Community Mobility Reports: 提供关于应对 COVID-19 政策的移动趋势变化的洞察。

疫情报告

病例报告

  • Dati COVID-19 Italia: 意大利的病例数据。
  • CSSE COVID-19 Dataset: 每日病例报告。
  • Novel Corona Virus 2019 Dataset: 包含 2019 年新冠病毒的每日受影响病例、死亡和康复数据。
  • nCoV2019: 来自国家、省和市卫生报告的个人级数据,包含地理编码和相关信息。
  • COVID-19_US_County-level_Summaries: 与社会经济因素相关的机器可读数据集,可能影响流行病学爆发的传播和后果。
  • C3.ai COVID-19 Data Lake: 自 2020 年 4 月 13 日起,向全球研究社区免费提供的统一、开放的 COVID-19 数据图像。
  • US COVID-19 Daily Cases with Basemap: 包含美国州和县级的 COVID-19 每日病例数据。
  • China Health Facilities: 中国的医疗机构 POI,如医院。
  • COVID-19 Metadata: 关于 COVID-19 大流行的国家/城市级元数据集合,便于二次分析。
  • NY COVID-19: 纽约市收集的关于 COVID-19 阳性测试者的最新信息。

资源报告

  • California COVID-19 Hospital Data and Case Statistics: 加利福尼亚 COVID-19 医院数据和病例统计。

数据集合

  • delphi-epidata: 美国各地的 COVID-19 活动水平指标,源自多个合作伙伴提供的匿名、聚合数据源。
  • data-covid19: 包含疫情情况、科学研究、知识图谱、媒体信息等方面的数据集。
  • α-Satellite: 一个 AI 驱动的系统,用于分层社区级风险评估,帮助应对 COVID-19。
  • Coronavirus Knowledge Hub: 提供关于 COVID-19 和冠状病毒的最新研究文章、信息和评论的资源。
  • COVID-19 GIS Hub: 提供关于新冠病毒疾病 2019(COVID-19)的地图、数据集、应用程序等。
  • Google COVID-19: 包含公共数据集的存储库,如约翰霍普金斯大学系统科学与工程中心(JHU CSSE)、美国人口普查局的美国社区调查(ACS)和 OpenStreetMaps 数据。
  • Amazon COVID-19 Data Lake: 包含 COVID-19 病例跟踪数据、医院床位可用性和超过 45,000 篇关于 COVID-19 和相关冠状病毒的研究文章。
  • COVID-19 Pandemic: 包含 WHO 发布的有人道主义响应计划的地区的 COVID-19 大流行数据。
  • Coronavirus COVID-19 (2019-nCoV) Epidemic Datasets: 提供全球细粒度数据,并与人口统计、空气污染等外生变量合并,以更好地理解 COVID-19。
  • COVID-19 Public Repository Data: 包含关于 2019 年新冠病毒和相关 COVID-19 疾病的公共项目托管在 GitHub 上的综合版本化数据集和相关元数据。

其他

  • CoronaQs : FAQs dataset: 从政府、联合国、WHO 等可信资源收集的带有标签的常见问题 HTML 可渲染数据集。
  • Policies and Regulations Timeline: 中国政府、全球组织、西方国家等发布的政策和法规时间线。
  • stayinghomeclub: 列出采取措施应对 COVID-19 传播的公司。
  • World Bank Indicators of Interest of the COVID-19 Outbreak: 世界银行发布的与 COVID-19 爆发相关的感兴趣指标。
  • SARS-CoV-2 Sequences: 当前在 GenBank 和序列读取存档(SRA)中可用的 SARS-CoV-2 序列列表。
  • Genomic epidemiology of novel coronavirus: 新冠病毒的基因组流行病学,全球子采样。
  • Postman COVID-19 API Resource Center: Postman 提供的 API 列表,用于信息交换。
  • Definitive Healthcare Public COVID-19 Data Repository: 医院床位可用性数据。
  • #COVID19 Government Measures Dataset: 包含全球政府为应对新冠病毒大流行实施的所有措施的数据集。
搜集汇总
数据集介绍
main_image_url
构建方式
MetaCOVID数据集的构建依托于亚利桑那州立大学DMML实验室的维护,整合了来自多个权威来源的COVID-19相关数据资源。该数据集通过爬取、整理和标注来自学术文献、新闻报道、社交媒体、地理空间数据以及流行病报告等多维度的信息,形成了一个全面且动态更新的数据集合。其构建过程注重数据的多样性和时效性,确保了数据的广泛覆盖和实时更新。
使用方法
MetaCOVID数据集的使用方法灵活多样,适用于多种研究场景。研究者可以通过GitHub页面访问数据集,并根据需求下载特定领域的数据资源。数据集中的学术文献和新闻报道可用于疫情相关的社会科学研究,社交媒体数据可用于分析公众情绪和信息传播模式,地理空间数据则可用于研究疫情对人口流动的影响。此外,数据集还提供了详细的元数据和标注信息,便于研究者进行数据清洗和分析。通过结合不同领域的数据,研究者可以深入探讨COVID-19对社会的多方面影响。
背景与挑战
背景概述
MetaCOVID数据集由亚利桑那州立大学的DMML实验室维护,旨在为COVID-19相关研究提供全面的数据资源。该数据集涵盖了从学术文献、新闻报道到社交媒体等多个维度的信息,旨在帮助研究人员追踪和分析COVID-19的传播、影响及社会反应。数据集的核心研究问题包括疫情传播的动态监测、社会行为的变化分析以及虚假信息的识别与应对。MetaCOVID的创建为全球范围内的COVID-19研究提供了重要的数据支持,推动了公共卫生、社会科学和计算科学等领域的交叉研究。
当前挑战
MetaCOVID数据集在解决COVID-19相关领域问题时面临多重挑战。首先,数据来源的多样性和异构性使得数据整合与清洗变得复杂,尤其是社交媒体数据的噪声和虚假信息问题尤为突出。其次,数据的实时性和动态性要求数据集必须持续更新,这对数据采集和存储技术提出了较高要求。此外,数据隐私和伦理问题也是构建过程中不可忽视的挑战,尤其是在处理个人健康数据和地理位置信息时,必须确保数据的匿名化和合规性。这些挑战不仅影响了数据集的质量,也对后续研究的可靠性和有效性提出了更高的要求。
常用场景
经典使用场景
MetaCOVID数据集在COVID-19研究领域中具有广泛的应用,尤其是在社会行为分析和流行病传播模型的构建中。研究人员通过该数据集中的社交媒体数据、新闻文章和地理空间信息,能够深入分析疫情对公众行为的影响,并预测疫情传播的趋势。例如,利用Twitter数据可以追踪公众对疫情的实时反应,而地理空间数据则帮助研究者理解疫情在不同地区的传播模式。
解决学术问题
MetaCOVID数据集为学术界提供了丰富的数据资源,解决了COVID-19研究中多个关键问题。通过整合多源数据,研究者能够更全面地分析疫情对社会、经济和公共卫生的影响。例如,数据集中的新闻和社交媒体数据帮助识别和验证疫情相关的谣言和虚假信息,而病例报告和流行病学数据则为疫情传播模型的构建和验证提供了基础。这些数据不仅支持了疫情的实时监测,还为政策制定者提供了科学依据。
实际应用
MetaCOVID数据集在实际应用中具有重要价值,尤其是在公共卫生管理和政策制定中。政府部门和公共卫生机构可以利用该数据集中的病例报告和地理空间数据,实时监控疫情的发展趋势,并制定相应的防控措施。此外,社交媒体数据的分析帮助识别公众对疫情的反应,从而优化信息传播策略,减少恐慌和误解。这些应用不仅提升了疫情应对的效率,还为未来的公共卫生危机管理提供了宝贵的经验。
数据集最近研究
最新研究方向
MetaCOVID数据集作为COVID-19研究的重要资源,近年来在多个前沿领域展现了其独特价值。在社会科学领域,研究者利用该数据集中的社交媒体数据(如Twitter推文)分析公众对疫情的实时反应,揭示信息传播与谣言扩散的机制。同时,结合地理空间数据,MetaCOVID为疫情传播的动态建模提供了关键支持,帮助预测疫情扩散趋势并评估防控措施的效果。此外,该数据集还推动了疫情相关科学文献的文本挖掘研究,特别是在CORD-19等学术资源的基础上,研究者能够快速提取关键信息,加速疫苗开发和治疗方案的研究。MetaCOVID的跨学科特性使其成为全球应对COVID-19疫情的重要工具,为政策制定和公共卫生决策提供了科学依据。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作