five

nbtpj/BioNLP2021

收藏
Hugging Face2023-01-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nbtpj/BioNLP2021
下载链接
链接失效反馈
官方服务:
资源简介:
BioNLP2021数据集(Task2)包含以下字段:文本(text)、摘要(summ_abs和summ_ext)、问题(question)以及原始数据集中的键(key)。文本部分使用<SAS>标记分隔不同的部分和文章,使用<DOC>标记分隔单个文档,使用<SS>标记分隔句子。摘要和问题也使用<SS>标记分隔句子。

# BioNLP2021数据集(任务2) ___ 数据字段: * text(字符串类型):源文本;仅训练多模态(train_mul)子集的章节与文章以&lt;SAS&gt;分隔;单篇文档以&lt;DOC&gt;分隔;句子以&lt;SS&gt;分隔。 * summ_abs、summ_ext(字符串类型):分别为抽象式摘要(abstractive summarization)与抽取式摘要(extractive summarization),其内部句子以&lt;SS&gt;分隔。 * question(字符串类型):问题文本,其内部句子以&lt;SS&gt;分隔。 * key(字符串类型):原始数据集对应的键值(用于提交任务)
提供机构:
nbtpj
原始信息汇总

BioNLP2021 dataset (Task2) 数据集概述

数据字段

  • text (str): 源文本,包含以下分隔符:
    • <SAS>: 用于分隔 Section 和 Article(仅在 train_mul 子集中)。
    • <DOC>: 用于分隔单个文档。
    • <SS>: 用于分隔句子。
  • summ_abs, summ_ext (str): 摘要信息,包括摘要式和提取式摘要,句子之间使用 <SS> 分隔。
  • question (str): 问题文本,句子之间使用 <SS> 分隔。
  • key (str): 原始数据集中的关键字段,用于提交。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作