five

nbtpj/bionlp2021MAS

收藏
Hugging Face2022-08-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nbtpj/bionlp2021MAS
下载链接
链接失效反馈
官方服务:
资源简介:
MEDIQUA2012-MAS任务的数据集包含多个答案摘要,每个问题都有唯一的键、问题文本、所有答案文本的合并(如果是训练集,则是文章和部分的合并)、抽象性多答案摘要和提取性多答案摘要。训练文章和训练部分的结构与训练集相同,但文本内容不同,训练文章的文本是所有子答案文章的合并,训练部分的文本是所有子答案部分的合并。

The dataset for the MEDIQUA2012-MAS task contains multiple answer summaries. Each question has a unique key, question text, merged text of all answer texts (for the training set, this is the concatenation of articles and sections), abstractive multi-answer summaries, and extractive multi-answer summaries. The training articles and training sections share the same structure as the training set, but differ in text content. Specifically, the text of the training articles is the concatenation of all sub-answer articles, while the text of the training sections is the concatenation of all sub-answer sections.
提供机构:
nbtpj
原始信息汇总

数据集概述

数据集名称

MEDIQUA2012-MAS task

数据来源

数据特征

  • key: 每个问题的关键标识。
  • question: 问题内容。
  • text: 所有答案文本的合并(训练集部分包括文章和节选的合并)。
  • sum_abs: 抽象的多答案摘要。
  • sum_ext: 提取的多答案摘要。

训练数据结构

  • train: 文本为所有答案文本的合并(训练集部分包括文章和节选的合并)。
  • train_article: 文本为所有子答案文章的合并。
  • train_sec: 文本为所有子答案节选的合并。

许可证

afl-3.0

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作