five

KPTimes

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/KPTimes
下载链接
链接失效反馈
官方服务:
资源简介:
关键词生成是预测一组传达源文本主要内容的词汇单元的任务。用于生成关键短语的现有数据集仅适用于学术领域,并且包括非专家注释。在本文中,我们介绍了 KPTimes,这是一个大规模的新闻文本数据集,与编辑器策划的关键词配对。通过探索数据集,我们展示了编辑者如何标记文档,以及它们的注释与现有数据集中的注释有何不同。我们还在 KPTimes 上训练和评估最先进的神经关键词生成模型,以深入了解它们在新闻领域的表现。该数据集可在 https://github.com/ygorg/KPTimes 在线获取。
提供机构:
OpenDataLab
创建时间:
2022-06-07
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作