nbtpj/BioNLP2021

Name: nbtpj/BioNLP2021
Creator: nbtpj
Published: 2023-01-02 02:11:44
License: 暂无描述

Hugging Face2023-01-02 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/nbtpj/BioNLP2021

下载链接

链接失效反馈

官方服务：

资源简介：

BioNLP2021数据集（Task2）包含以下字段：文本（text）、摘要（summ_abs和summ_ext）、问题（question）以及原始数据集中的键（key）。文本部分使用<SAS>标记分隔不同的部分和文章，使用<DOC>标记分隔单个文档，使用<SS>标记分隔句子。摘要和问题也使用<SS>标记分隔句子。

# BioNLP2021数据集（任务2） ___ 数据字段： * text（字符串类型）：源文本；仅训练多模态（train_mul）子集的章节与文章以<SAS>分隔；单篇文档以<DOC>分隔；句子以<SS>分隔。 * summ_abs、summ_ext（字符串类型）：分别为抽象式摘要（abstractive summarization）与抽取式摘要（extractive summarization），其内部句子以<SS>分隔。 * question（字符串类型）：问题文本，其内部句子以<SS>分隔。 * key（字符串类型）：原始数据集对应的键值（用于提交任务）

提供机构：

nbtpj

原始信息汇总

BioNLP2021 dataset (Task2) 数据集概述

数据字段

text (str): 源文本，包含以下分隔符：
- <SAS>: 用于分隔 Section 和 Article（仅在 train_mul 子集中）。
- <DOC>: 用于分隔单个文档。
- <SS>: 用于分隔句子。
summ_abs, summ_ext (str): 摘要信息，包括摘要式和提取式摘要，句子之间使用 <SS> 分隔。
question (str): 问题文本，句子之间使用 <SS> 分隔。
key (str): 原始数据集中的关键字段，用于提交。

5,000+

优质数据集

54 个

任务类型

进入经典数据集