five

nlpie/pandemic_pact

收藏
Hugging Face2025-02-16 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/nlpie/pandemic_pact
下载链接
链接失效反馈
官方服务:
资源简介:
Pandemic PACT数据集旨在促进将生物医学研究摘要分类为与WHO优先事项一致的特定研究类别。该数据集特别适用于监测研究趋势和识别全球卫生准备和响应中的差距。数据集包括来自Pandemic Preparedness Analytical Capacity and Funding Tracking Programme(Pandemic PACT)计划的注释研究项目,每个条目包括项目标题、摘要、LLM生成的解释以及由人类专家注释者分配的研究类别。

The Pandemic PACT dataset is designed to facilitate the classification of biomedical research abstracts into specific research categories aligned with WHO priorities. This dataset consists of annotated research projects from the Pandemic Preparedness Analytical Capacity and Funding Tracking Programme (Pandemic PACT) initiative. Each entry includes a project title, abstract, LLM-generated rationales, and research categories assigned by human expert annotators. The dataset is split into a train set and a validation set, with each example containing fields such as title, abstract, explanation, categories, promptedText, rawText, and output. This dataset is ideal for training and evaluating models on biomedical document classification tasks, supporting advancements in aligning biomedical research with key global health priorities.
提供机构:
nlpie
原始信息汇总

Pandemic PACT 数据集概述

数据集描述

Pandemic PACT 数据集旨在促进将生物医学研究摘要分类到与世界卫生组织优先事项对齐的特定研究类别中。该数据集特别适用于监测研究趋势和识别全球卫生准备和响应中的差距。

数据来源与组成

数据集包含来自 Pandemic Preparedness Analytical Capacity and Funding Tracking Programme (Pandemic PACT) 倡议的注释研究项目。每个条目包括项目标题、摘要、由大型语言模型生成的理由以及由人类专家注释者分配的研究类别。

注释过程

注释由经过培训的研究人员执行,每个项目被分类到一个或多个以下研究类别:

  1. 病原体:自然历史、传播和诊断
  2. 动物和环境研究及疾病媒介研究
  3. 流行病学研究
  4. 人类临床特征和管理
  5. 感染预防和控制
  6. 治疗研究、开发和实施
  7. 疫苗研究、开发和实施
  8. 研究以告知伦理问题
  9. 公共卫生、疾病控制和社区复原力的政策
  10. 疾病、响应和控制措施的次要影响
  11. 卫生系统研究
  12. 能力加强

数据集结构

数据集分为两个部分:

  • 训练集:5142 个样本,61388809 字节
  • 验证集:1450 个样本,13801298 字节

每个样本包含以下字段:

  • title:研究项目标题
  • abstract:研究项目的详细摘要
  • explanation:由大型语言模型生成的类别分配理由
  • categories:分配的研究类别
  • promptedText:用于提示模型的文本
  • rawText:项目描述的原始文本
  • output:模型输出

使用与应用

该数据集非常适合用于训练和评估生物医学文档分类任务的模型。它支持生物医学研究与关键全球卫生优先事项的对齐,为研究人员、政策制定者和独立学者提供了一个宝贵的资源。

搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作