OrangeSum
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/OrangeSum
下载链接
链接失效反馈官方服务:
资源简介:
OrangeSum 是一个单文档极端摘要数据集,具有两个任务:标题和摘要。标题和摘要任务的基本事实摘要平均长度分别为 11.42 和 32.12 个单词,而文档大小分别为 315 和 350 个单词。_x000D_
_x000D_
OrangeSum 的动机是将 XSum 数据集的法语等价物放在一起。_x000D_
_x000D_
与历史上的 CNN、DailyMail 和 NY Times 数据集不同,OrangeSum 需要模型显示高度抽象性才能表现良好。 OrangeSum 是通过从 Orange Actu 网站上抓取文章及其标题和摘要创建的。_x000D_
_x000D_
刮掉的页面涵盖了从 2011 年 2 月到 2020 年 9 月的近十年,分为五个主要类别:法国、世界、政治、汽车和社会。社会类别本身分为 8 个子类别:健康、环境、人、文化、媒体、高科技、不正常(法语中的“insolite”)和杂项。
提供机构:
OpenDataLab
创建时间:
2022-05-23



