arthurmluz/cstnews_data-xlsum_cstnews_1024_results
收藏Hugging Face2023-11-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/arthurmluz/cstnews_data-xlsum_cstnews_1024_results
下载链接
链接失效反馈官方服务:
资源简介:
数据集cstnews_data-xlsumm_cstnews_1024_results包含多个特征字段,如id、text、summary、gen_summary、rouge、bert和moverScore。其中,rouge和bert字段包含子结构,分别用于存储ROUGE和BERT评分结果。数据集仅包含一个验证集,大小为56397字节,包含16个样本。此外,README中还提供了ROUGE、BERT和MoverScore的具体评分结果。
提供机构:
arthurmluz
原始信息汇总
数据集概述
数据集信息
-
特征列表:
id: 类型为字符串。text: 类型为字符串。summary: 类型为字符串。gen_summary: 类型为字符串。rouge: 包含以下结构:rouge1: 类型为浮点数。rouge2: 类型为浮点数。rougeL: 类型为浮点数。rougeLsum: 类型为浮点数。
bert: 包含以下结构:f1: 类型为浮点数序列。hashcode: 类型为字符串。precision: 类型为浮点数序列。recall: 类型为浮点数序列。
moverScore: 类型为浮点数。
-
数据分割:
validation: 包含56397字节的数据,共有16个样本。
-
数据集大小:
- 下载大小: 54256字节。
- 数据集大小: 56397字节。
配置信息
- 默认配置:
- 数据文件路径:
data/validation-*。
- 数据文件路径:
评估指标
-
ROUGE指标:
rouge1: 0.5573278177294199rouge2: 0.37453934272536266rougeL: 0.4198626248383525rougeLsum: 0.4198626248383525
-
BERT指标:
precision: 0.8057523816823959recall: 0.7992453724145889f1: 0.8017213456332684
-
MoverScore:
- 0.6422802882004404



