WikiCatSum
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/WikiCatSum
下载链接
链接失效反馈官方服务:
资源简介:
WikiCatSum 是一个特定领域的多文档摘要(MDS)数据集。它承担从维基百科文章中引用或由谷歌返回的文档集(使用文章标题作为查询)为特定领域的维基百科实体(例如公司)生成维基百科主要部分的摘要任务。该数据集包括三个领域:公司、电影和动物。
提供机构:
OpenDataLab
创建时间:
2022-05-07
搜集汇总
数据集介绍

背景与挑战
背景概述
WikiCatSum是一个针对特定领域(包括公司、电影和动物)的多文档摘要数据集,用于基于维基百科文章和谷歌查询结果生成实体摘要。该数据集由爱丁堡大学于2019年发布,包含约22.1k样本,总规模为4.9GB。
以上内容由遇见数据集搜集并总结生成



