arthurmluz/GPTextSum2_data-wiki_cstnews_results
收藏Hugging Face2023-11-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/arthurmluz/GPTextSum2_data-wiki_cstnews_results
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: int64
- name: text
dtype: string
- name: summary
dtype: string
- name: gen_summary
dtype: string
- name: rouge
struct:
- name: rouge1
dtype: float64
- name: rouge2
dtype: float64
- name: rougeL
dtype: float64
- name: rougeLsum
dtype: float64
- name: bert
struct:
- name: f1
sequence: float64
- name: hashcode
dtype: string
- name: precision
sequence: float64
- name: recall
sequence: float64
- name: moverScore
dtype: float64
splits:
- name: validation
num_bytes: 92922
num_examples: 20
download_size: 89357
dataset_size: 92922
configs:
- config_name: default
data_files:
- split: validation
path: data/validation-*
---
# Dataset Card for "GPTextSum2_data-wiki_cstnews_results"
rouge= {'rouge1': 0.40559145209215386, 'rouge2': 0.1858323707445477, 'rougeL': 0.2713738809702273, 'rougeLsum': 0.2713738809702273}
bert= {'precision': 0.7676798492670059, 'recall': 0.7191876947879792, 'f1': 0.7423095703125}
mover = 0.6047207310084797
数据集信息:
特征:
- 特征名:id,数据类型:int64
- 特征名:text,数据类型:字符串
- 特征名:summary,数据类型:字符串
- 特征名:gen_summary,数据类型:字符串
- 特征名:rouge,为结构体类型,包含以下子特征:
- rouge1:float64类型
- rouge2:float64类型
- rougeL:float64类型
- rougeLsum:float64类型
- 特征名:bert,为结构体类型,包含以下子特征:
- f1:float64类型的序列
- hashcode:字符串类型
- precision:float64类型的序列
- recall:float64类型的序列
- 特征名:moverScore,数据类型:float64
数据集划分:
- 划分名称:validation(验证集),字节数:92922,样本数量:20
下载大小:89357,数据集总大小:92922
配置项:
- 配置名称:default(默认配置),数据文件:
- 对应validation(验证集)划分,路径:data/validation-*
---
# 「GPTextSum2_data-wiki_cstnews_results」数据集卡片
ROUGE评价指标结果:
{'rouge1': 0.40559145209215386, 'rouge2': 0.1858323707445477, 'rougeL': 0.2713738809702273, 'rougeLsum': 0.2713738809702273}
BERT评价指标结果:
{'precision': 0.7676798492670059, 'recall': 0.7191876947879792, 'f1': 0.7423095703125}
moverScore得分为:0.6047207310084797
提供机构:
arthurmluz
原始信息汇总
数据集概述
数据集信息
特征
- id: 数据类型为
int64 - text: 数据类型为
string - summary: 数据类型为
string - gen_summary: 数据类型为
string - rouge: 结构化数据,包含以下字段:
- rouge1: 数据类型为
float64 - rouge2: 数据类型为
float64 - rougeL: 数据类型为
float64 - rougeLsum: 数据类型为
float64
- rouge1: 数据类型为
- bert: 结构化数据,包含以下字段:
- f1: 数据类型为
float64的序列 - hashcode: 数据类型为
string - precision: 数据类型为
float64的序列 - recall: 数据类型为
float64的序列
- f1: 数据类型为
- moverScore: 数据类型为
float64
数据分割
- validation: 包含 20 个样本,总字节数为 92922
数据集大小
- 下载大小: 89357 字节
- 数据集大小: 92922 字节
配置
- default: 包含验证集文件路径为
data/validation-*
评估指标
- rouge:
- rouge1: 0.40559145209215386
- rouge2: 0.1858323707445477
- rougeL: 0.2713738809702273
- rougeLsum: 0.2713738809702273
- bert:
- precision: 0.7676798492670059
- recall: 0.7191876947879792
- f1: 0.7423095703125
- moverScore: 0.6047207310084797



