nbtpj/bionlp2021MAS
收藏Hugging Face2022-08-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nbtpj/bionlp2021MAS
下载链接
链接失效反馈官方服务:
资源简介:
MEDIQUA2012-MAS任务的数据集包含多个答案摘要,每个问题都有唯一的键、问题文本、所有答案文本的合并(如果是训练集,则是文章和部分的合并)、抽象性多答案摘要和提取性多答案摘要。训练文章和训练部分的结构与训练集相同,但文本内容不同,训练文章的文本是所有子答案文章的合并,训练部分的文本是所有子答案部分的合并。
The dataset for the MEDIQUA2012-MAS task contains multiple answer summaries. Each question has a unique key, question text, merged text of all answer texts (for the training set, this is the concatenation of articles and sections), abstractive multi-answer summaries, and extractive multi-answer summaries. The training articles and training sections share the same structure as the training set, but differ in text content. Specifically, the text of the training articles is the concatenation of all sub-answer articles, while the text of the training sections is the concatenation of all sub-answer sections.
提供机构:
nbtpj
原始信息汇总
数据集概述
数据集名称
MEDIQUA2012-MAS task
数据来源
数据特征
- key: 每个问题的关键标识。
- question: 问题内容。
- text: 所有答案文本的合并(训练集部分包括文章和节选的合并)。
- sum_abs: 抽象的多答案摘要。
- sum_ext: 提取的多答案摘要。
训练数据结构
- train: 文本为所有答案文本的合并(训练集部分包括文章和节选的合并)。
- train_article: 文本为所有子答案文章的合并。
- train_sec: 文本为所有子答案节选的合并。
许可证
afl-3.0



