mediasum
收藏Opencsg2024-07-19 更新2025-05-03 收录
下载链接:
https://www.opencsg.com/datasets/AIWizards/mediasum
下载链接
链接失效反馈官方服务:
资源简介:
MediaSum是一个大规模媒体访谈数据集,包含46.36万条带有概括性摘要的转录文本,数据来源于NPR和CNN的访谈记录和主题描述。每个样本包括唯一的ID、节目名称、日期、URL、标题、摘要以及发言者和对应的发言内容。数据集分为训练集(443,596条)、验证集(10,000条)和测试集(10,000条)。该数据集主要用于对话摘要的研究任务。虽然未指定明确的授权许可,但作者要求该数据集仅用于研究目的。
创建时间:
2024-07-19



