arthurmluz/wikilingua_data-xlsum_temario_results
收藏Hugging Face2023-11-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/arthurmluz/wikilingua_data-xlsum_temario_results
下载链接
链接失效反馈官方服务:
资源简介:
数据集wikilingua_data-xlsum_temario_results包含多个特征字段,如id、text、summary、gen_summary、rouge、bert和moverScore。其中,rouge和bert字段包含子结构,分别用于评估文本摘要的ROUGE和BERT分数。数据集仅包含一个验证集,大小为24426752字节,包含8165个样本。README文件还提供了ROUGE、BERT和MoverScore的评估结果。
提供机构:
arthurmluz
原始信息汇总
数据集概述
数据集信息
特征
- id: 数据类型为
int64 - text: 数据类型为
string - summary: 数据类型为
string - gen_summary: 数据类型为
string - rouge: 结构化数据,包含以下字段:
- rouge1: 数据类型为
float64 - rouge2: 数据类型为
float64 - rougeL: 数据类型为
float64 - rougeLsum: 数据类型为
float64
- rouge1: 数据类型为
- bert: 结构化数据,包含以下字段:
- f1: 数据类型为
float64序列 - hashcode: 数据类型为
string - precision: 数据类型为
float64序列 - recall: 数据类型为
float64序列
- f1: 数据类型为
- moverScore: 数据类型为
float64
数据分割
- validation: 包含 8165 个样本,占用 24426752 字节
数据大小
- 下载大小: 14578091 字节
- 数据集大小: 24426752 字节
配置
- default: 包含验证集文件路径
data/validation-*
评估指标
- rouge:
- rouge1: 0.22676756630166944
- rouge2: 0.05733749409742467
- rougeL: 0.14739216031183608
- rougeLsum: 0.14739216031183608
- bert:
- precision: 0.6762088215285404
- recall: 0.7127016072322895
- f1: 0.6928288537413521
- moverScore: 0.5831551191071093



