arthurmluz/GPTextSum_data-wiki_gptextsum2_results
收藏Hugging Face2023-11-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/arthurmluz/GPTextSum_data-wiki_gptextsum2_results
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: int64
- name: text
dtype: string
- name: summary
dtype: string
- name: gen_summary
dtype: string
- name: rouge
struct:
- name: rouge1
dtype: float64
- name: rouge2
dtype: float64
- name: rougeL
dtype: float64
- name: rougeLsum
dtype: float64
- name: bert
struct:
- name: f1
sequence: float64
- name: hashcode
dtype: string
- name: precision
sequence: float64
- name: recall
sequence: float64
- name: moverScore
dtype: float64
splits:
- name: validation
num_bytes: 93872
num_examples: 20
download_size: 90986
dataset_size: 93872
configs:
- config_name: default
data_files:
- split: validation
path: data/validation-*
---
# Dataset Card for "GPTextSum_data-wiki-gptextsum_results"
rouge= {'rouge1': 0.4600676970614709, 'rouge2': 0.2024089594170197, 'rougeL': 0.28630530856939856, 'rougeLsum': 0.28630530856939856}
bert= {'precision': 0.7757186979055405, 'recall': 0.7327599436044693, 'f1': 0.7533363491296768}
数据集信息:
特征字段:
- 字段名:id,数据类型:int64(64位整数)
- 字段名:text,数据类型:字符串
- 字段名:summary,数据类型:字符串
- 字段名:gen_summary,数据类型:字符串
- 字段名:rouge(ROUGE评价指标,Recall-Oriented Understudy for Gisting Evaluation),结构体类型,包含子字段:
- rouge1:float64(64位双精度浮点数)
- rouge2:float64
- rougeL:float64
- rougeLsum:float64
- 字段名:bert(BERT模型,Bidirectional Encoder Representations from Transformers),结构体类型,包含子字段:
- f1:float64序列(64位双精度浮点数序列)
- hashcode:字符串
- precision:float64序列
- recall:float64序列
- 字段名:moverScore(MoverScore移动评分),数据类型:float64(64位双精度浮点数)
数据拆分:
- 拆分名称:验证集(validation),字节数:93872,样本量:20
下载总大小:90986
数据集总占用空间:93872
配置项:
- 配置名称:默认配置(default),数据文件:
- 对应拆分:验证集(validation),路径:data/validation-*
---
# 「GPTextSum_data-wiki-gptextsum_results」数据集卡片
ROUGE评价指标结果:{'rouge1': 0.4600676970614709, 'rouge2': 0.2024089594170197, 'rougeL': 0.28630530856939856, 'rougeLsum': 0.28630530856939856}
BERT模型指标结果:{'precision': 0.7757186979055405, 'recall': 0.7327599436044693, 'f1': 0.7533363491296768}
提供机构:
arthurmluz
原始信息汇总
数据集概述
数据集信息
特征
- id: 数据类型为
int64 - text: 数据类型为
string - summary: 数据类型为
string - gen_summary: 数据类型为
string - rouge: 结构体,包含以下字段:
- rouge1: 数据类型为
float64 - rouge2: 数据类型为
float64 - rougeL: 数据类型为
float64 - rougeLsum: 数据类型为
float64
- rouge1: 数据类型为
- bert: 结构体,包含以下字段:
- f1: 序列类型为
float64 - hashcode: 数据类型为
string - precision: 序列类型为
float64 - recall: 序列类型为
float64
- f1: 序列类型为
- moverScore: 数据类型为
float64
数据分割
- validation: 字节数为 93872,样本数为 20
数据大小
- 下载大小: 90986 字节
- 数据集大小: 93872 字节
配置
- default: 包含
validation分割的数据文件路径为data/validation-*
评估指标
ROUGE 指标
- rouge1: 0.4600676970614709
- rouge2: 0.2024089594170197
- rougeL: 0.28630530856939856
- rougeLsum: 0.28630530856939856
BERT 指标
- precision: 0.7757186979055405
- recall: 0.7327599436044693
- f1: 0.7533363491296768



