giuliadc/newsroom_test
收藏Hugging Face2024-06-21 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/giuliadc/newsroom_test
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是Newsroom数据集的测试集,经过Aumiller等人的代码过滤,用于摘要生成任务。数据集语言为英语,规模在10K到100K之间。过滤条件为摘要最小长度为18,参考文本最小长度为250,长度度量为空格。
该数据集是Newsroom数据集的测试集,经过Aumiller等人的代码过滤,用于摘要生成任务。数据集语言为英语,规模在10K到100K之间。过滤条件为摘要最小长度为18,参考文本最小长度为250,长度度量为空格。
提供机构:
giuliadc
原始信息汇总
数据集概述
任务类别
- 摘要生成
语言
- 英语
数据集规模
- 10K<n<100K
数据集来源
- 基于Newsroom数据集的测试分割,通过Aumiller等人的代码进行过滤。
过滤条件
- 摘要的最小长度:18个空白字符
- 参考文本的最小长度:250个空白字符
- 长度度量标准:空白字符



