five

medalpaca/medical_meadow_cord19

收藏
Hugging Face2023-04-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/medalpaca/medical_meadow_cord19
下载链接
链接失效反馈
官方服务:
资源简介:
CORD 19数据集是为了响应COVID-19疫情,由白宫和多个领先研究团体共同准备的,包含超过1,000,000篇学术文章,其中超过400,000篇有全文,涉及COVID-19、SARS-CoV-2及相关冠状病毒。该数据集旨在支持全球研究社区应用自然语言处理和其他AI技术,以生成新的见解来支持对抗这一传染病的斗争。这是一个经过处理的版本,移除了部分空条目并格式化以兼容alpaca训练。

CORD 19数据集是为了响应COVID-19疫情,由白宫和多个领先研究团体共同准备的,包含超过1,000,000篇学术文章,其中超过400,000篇有全文,涉及COVID-19、SARS-CoV-2及相关冠状病毒。该数据集旨在支持全球研究社区应用自然语言处理和其他AI技术,以生成新的见解来支持对抗这一传染病的斗争。这是一个经过处理的版本,移除了部分空条目并格式化以兼容alpaca训练。
提供机构:
medalpaca
原始信息汇总

CORD-19 数据集概述

基本信息

  • 任务类别: 摘要生成
  • 语言: 英语
  • 数据集大小: 100K<n<1M

数据集描述

  • 数据集名称: COVID-19 Open Research Dataset (CORD-19)
  • 数据集目的: 为全球研究社区提供一个包含超过1,000,000篇学术文章的资源,其中超过400,000篇包含全文,内容涉及COVID-19、SARS-CoV-2及相关冠状病毒。此数据集旨在支持应用自然语言处理和其他AI技术,以产生对抗击传染病的新见解。
  • 数据处理: 本数据集为处理版本,已移除部分空项并格式化,以便与alpaca训练兼容。

引用信息

@inproceedings{wang-etal-2020-cord, title = "{CORD-19}: The {COVID-19} Open Research Dataset", author = "Wang, Lucy Lu and Lo, Kyle and Chandrasekhar, Yoganand and Reas, Russell and Yang, Jiangjiang and Burdick, Doug and Eide, Darrin and Funk, Kathryn and Katsis, Yannis and Kinney, Rodney Michael and Li, Yunyao and Liu, Ziyang and Merrill, William and Mooney, Paul and Murdick, Dewey A. and Rishi, Devvret and Sheehan, Jerry and Shen, Zhihong and Stilson, Brandon and Wade, Alex D. and Wang, Kuansan and Wang, Nancy Xin Ru and Wilhelm, Christopher and Xie, Boya and Raymond, Douglas M. and Weld, Daniel S. and Etzioni, Oren and Kohlmeier, Sebastian", booktitle = "Proceedings of the 1st Workshop on {NLP} for {COVID-19} at {ACL} 2020", month = jul, year = "2020", address = "Online", publisher = "Association for Computational Linguistics", url = "https://www.aclweb.org/anthology/2020.nlpcovid19-acl.1" }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作