allenai/mslr2022
收藏Hugging Face2022-11-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/allenai/mslr2022
下载链接
链接失效反馈官方服务:
资源简介:
MSLR2022数据集旨在研究如何从不同的临床研究中总结医学证据,并促进NLP技术在医学文献综述自动化摘要生成中的应用。该数据集包含两个主要的数据源:MS^2和Cochrane,数据规模在10K到100K之间,语言为英语。数据集的创建由专家生成,任务类别包括摘要生成和文本生成。
The MSLR2022 dataset is designed to investigate how to synthesize medical evidence from diverse clinical studies and facilitate the application of natural language processing (NLP) technologies in automated abstract generation for medical literature reviews. This dataset includes two primary data sources: MS^2 and Cochrane, with a corpus size ranging from 10K to 100K, and all text is in English. The dataset was curated by domain experts, and its supported task categories cover abstract generation and text generation.
提供机构:
allenai
原始信息汇总
数据集概述
数据集名称
- 名称: MSLR Shared Task
- 别名: MSLR2022
数据集基本信息
- 语言: 英语
- 许可证: Apache-2.0
- 多语言性: 单语
- 大小类别: 10K<n<100K
数据集来源
- 源数据集:
- 扩展自 MS^2
- 扩展自 Cochrane
任务类别
- 任务类别:
- 摘要生成
- 文本到文本生成
数据集用途
- 用途: 用于研究医学文献综述中不同临床研究证据的摘要生成,旨在通过自然语言处理技术自动化高质量证据的合成过程。
数据集结构
- 数据实例示例: json { "review_id": "30760312", "pmid": [...], "title": [...], "abstract": [...] }
数据集创建
- 注释创建者: 专家生成
- 语言创建者: 专家生成
- 注释过程: 未详细说明
- 注释者身份: 未详细说明
使用考虑
- 社会影响: 未详细说明
- 偏见讨论: 未详细说明
- 其他已知限制: 未详细说明



