STACKEX
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/STACKEX
下载链接
链接失效反馈官方服务:
资源简介:
不同的文本本质上应对应不同数量的关键短语。现有的神经关键词生成模型很大程度上缺少这种需求。在这项研究中,我们从建模和评估的角度来解决这个问题。我们首先提出了一个循环生成模型,该模型生成多个关键短语作为分隔符分隔的序列。通过操纵解码器隐藏状态,两种新技术进一步增强了生成多样性。与以前的方法相比,我们的模型能够生成不同的关键词并控制输出数量。我们进一步提出了两个针对可变数字生成的评估指标。我们还引入了一个新的数据集 StackEx,该数据集扩展了关键短语生成任务中唯一现有的类型(即学术写作)。凭借先前和新的评估指标,我们的模型在所有数据集上都优于强大的基线。
提供机构:
OpenDataLab
创建时间:
2022-06-07
搜集汇总
数据集介绍

背景与挑战
背景概述
STACKEX是一个用于关键词生成研究的文本数据集,旨在解决现有模型在生成可变数量关键短语方面的不足。它扩展了学术写作领域的任务,并引入了新的生成模型与评估指标,以提升多样性和控制能力。
以上内容由遇见数据集搜集并总结生成



