arthurmluz/xlsum_data-xlsum_cstnews_1024_results
收藏Hugging Face2023-11-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/arthurmluz/xlsum_data-xlsum_cstnews_1024_results
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为xlsum_data-xlsumm_cstnews_1024_results,包含多种文本特征,如文章的id、url、标题、摘要、全文和自动生成的摘要等。此外,还提供了文本摘要质量的评估指标,包括rouge分数和bert分数,以及moverScore。数据集被分割为验证集,包含7175个例子,总大小为28015420字节。
该数据集名为xlsum_data-xlsumm_cstnews_1024_results,包含多种文本特征,如文章的id、url、标题、摘要、全文和自动生成的摘要等。此外,还提供了文本摘要质量的评估指标,包括rouge分数和bert分数,以及moverScore。数据集被分割为验证集,包含7175个例子,总大小为28015420字节。
提供机构:
arthurmluz
原始信息汇总
数据集概述
数据集信息
特征
- id: 字符串类型
- url: 字符串类型
- title: 字符串类型
- summary: 字符串类型
- text: 字符串类型
- gen_summary: 字符串类型
- rouge: 结构体类型
- rouge1: 浮点数类型
- rouge2: 浮点数类型
- rougeL: 浮点数类型
- rougeLsum: 浮点数类型
- bert: 结构体类型
- f1: 浮点数序列类型
- hashcode: 字符串类型
- precision: 浮点数序列类型
- recall: 浮点数序列类型
- moverScore: 浮点数类型
数据分割
- validation:
- 字节数: 28015420
- 样本数: 7175
数据大小
- 下载大小: 17143190
- 数据集大小: 28015420
配置
- default:
- 数据文件:
- 分割: validation
- 路径: data/validation-*
- 数据文件:
评估指标
- rouge:
- rouge1: 0.2759461774292122
- rouge2: 0.09432308277095043
- rougeL: 0.18435043787434557
- rougeLsum: 0.18435043787434557
- bert:
- precision: 0.6937206263243114
- recall: 0.7438775094544016
- f1: 0.7174445173050884
- mover: 0.5946254344345815



