five

allenai/mslr2022

收藏
Hugging Face2022-11-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/allenai/mslr2022
下载链接
链接失效反馈
官方服务:
资源简介:
MSLR2022数据集旨在研究如何从不同的临床研究中总结医学证据,并促进NLP技术在医学文献综述自动化摘要生成中的应用。该数据集包含两个主要的数据源:MS^2和Cochrane,数据规模在10K到100K之间,语言为英语。数据集的创建由专家生成,任务类别包括摘要生成和文本生成。

The MSLR2022 dataset is designed to investigate how to synthesize medical evidence from diverse clinical studies and facilitate the application of natural language processing (NLP) technologies in automated abstract generation for medical literature reviews. This dataset includes two primary data sources: MS^2 and Cochrane, with a corpus size ranging from 10K to 100K, and all text is in English. The dataset was curated by domain experts, and its supported task categories cover abstract generation and text generation.
提供机构:
allenai
原始信息汇总

数据集概述

数据集名称

  • 名称: MSLR Shared Task
  • 别名: MSLR2022

数据集基本信息

  • 语言: 英语
  • 许可证: Apache-2.0
  • 多语言性: 单语
  • 大小类别: 10K<n<100K

数据集来源

  • 源数据集:
    • 扩展自 MS^2
    • 扩展自 Cochrane

任务类别

  • 任务类别:
    • 摘要生成
    • 文本到文本生成

数据集用途

  • 用途: 用于研究医学文献综述中不同临床研究证据的摘要生成,旨在通过自然语言处理技术自动化高质量证据的合成过程。

数据集结构

  • 数据实例示例: json { "review_id": "30760312", "pmid": [...], "title": [...], "abstract": [...] }

数据集创建

  • 注释创建者: 专家生成
  • 语言创建者: 专家生成
  • 注释过程: 未详细说明
  • 注释者身份: 未详细说明

使用考虑

  • 社会影响: 未详细说明
  • 偏见讨论: 未详细说明
  • 其他已知限制: 未详细说明
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作