PS5k
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/atharsefid/extractive_research_slide_generation_using_windowed_labeling_ranking
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了来自不同会议进程网站的5000多份论文与幻灯片配对,旨在训练科学文档的摘要模型。平均而言,每个演示文稿包含35页幻灯片,每页幻灯片有8行文本。该数据集用于训练摘要模型,并已分为训练集(4500对)、验证集(250对)和测试集(250对)。规模达到了5000对论文与幻灯片的配对,任务是对科学文档进行摘要。
提供机构:
Manually curated



