MediaSum
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/MediaSum
下载链接
链接失效反馈官方服务:
资源简介:
MediaSum,一个大规模的媒体采访数据集,由463.6k成绩单和抽象摘要组成。为了创建这个数据集,我们从NPR和CNN收集采访记录,并使用概述和主题描述作为摘要。与现有的用于对话摘要的公共语料库相比,我们的数据集要大一个数量级,并且包含来自多个领域的复杂多方对话。我们进行统计分析,以证明电视和广播采访的笔录中表现出的独特位置偏差。我们还表明,MediaSum可用于迁移学习,以提高模型在其他对话摘要任务上的性能。
提供机构:
OpenDataLab
创建时间:
2023-10-11



