nbtpj/BioNLP2021
收藏Hugging Face2023-01-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nbtpj/BioNLP2021
下载链接
链接失效反馈官方服务:
资源简介:
BioNLP2021数据集(Task2)包含以下字段:文本(text)、摘要(summ_abs和summ_ext)、问题(question)以及原始数据集中的键(key)。文本部分使用<SAS>标记分隔不同的部分和文章,使用<DOC>标记分隔单个文档,使用<SS>标记分隔句子。摘要和问题也使用<SS>标记分隔句子。
# BioNLP2021数据集(任务2)
___
数据字段:
* text(字符串类型):源文本;仅训练多模态(train_mul)子集的章节与文章以<SAS>分隔;单篇文档以<DOC>分隔;句子以<SS>分隔。
* summ_abs、summ_ext(字符串类型):分别为抽象式摘要(abstractive summarization)与抽取式摘要(extractive summarization),其内部句子以<SS>分隔。
* question(字符串类型):问题文本,其内部句子以<SS>分隔。
* key(字符串类型):原始数据集对应的键值(用于提交任务)
提供机构:
nbtpj
原始信息汇总
BioNLP2021 dataset (Task2) 数据集概述
数据字段
- text (str): 源文本,包含以下分隔符:
- <SAS>: 用于分隔 Section 和 Article(仅在 train_mul 子集中)。
- <DOC>: 用于分隔单个文档。
- <SS>: 用于分隔句子。
- summ_abs, summ_ext (str): 摘要信息,包括摘要式和提取式摘要,句子之间使用 <SS> 分隔。
- question (str): 问题文本,句子之间使用 <SS> 分隔。
- key (str): 原始数据集中的关键字段,用于提交。



