arthurmluz/GPTextSum2_data-wiki_temario_results
收藏Hugging Face2023-11-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/arthurmluz/GPTextSum2_data-wiki_temario_results
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: int64
- name: text
dtype: string
- name: summary
dtype: string
- name: gen_summary
dtype: string
- name: rouge
struct:
- name: rouge1
dtype: float64
- name: rouge2
dtype: float64
- name: rougeL
dtype: float64
- name: rougeLsum
dtype: float64
- name: bert
struct:
- name: f1
sequence: float64
- name: hashcode
dtype: string
- name: precision
sequence: float64
- name: recall
sequence: float64
- name: moverScore
dtype: float64
splits:
- name: validation
num_bytes: 99153
num_examples: 20
download_size: 96177
dataset_size: 99153
configs:
- config_name: default
data_files:
- split: validation
path: data/validation-*
---
# Dataset Card for "GPTextSum2_data-wiki_temario_results"
rouge= {'rouge1': 0.45050324572461636, 'rouge2': 0.2010668922579611, 'rougeL': 0.28295192431911953, 'rougeLsum': 0.28295192431911953}
bert= {'precision': 0.7481734365224838, 'recall': 0.736190888285637, 'f1': 0.7416769295930863}
mover 0.6111134514384304
数据集信息:
特征项:
- 名称:id,数据类型:int64(整数64位)
- 名称:text(文本内容),数据类型:字符串
- 名称:summary(参考摘要),数据类型:字符串
- 名称:gen_summary(生成式摘要),数据类型:字符串
- 名称:ROUGE评估指标(ROUGE),结构体类型,包含子特征:
- 名称:rouge1,数据类型:float64(双精度浮点数)
- 名称:rouge2,数据类型:float64(双精度浮点数)
- 名称:rougeL,数据类型:float64(双精度浮点数)
- 名称:rougeLsum,数据类型:float64(双精度浮点数)
- 名称:BERT评估指标(BERT),结构体类型,包含子特征:
- 名称:f1(F1分数,F1-score),数据类型:float64序列
- 名称:hashcode(哈希码,Hashcode),数据类型:字符串
- 名称:precision(精确率,Precision),数据类型:float64序列
- 名称:recall(召回率,Recall),数据类型:float64序列
- 名称:移动分数(MoverScore),数据类型:float64(双精度浮点数)
数据集划分:
- 名称:验证集(validation),字节数:99153,示例数量:20
下载大小:96177,数据集总大小:99153
配置项:
- 配置名称:default(默认配置),数据文件:
- 划分:验证集(validation),路径:data/validation-*
---
# "GPTextSum2_data-wiki_temario_results"数据集卡片
ROUGE评估指标结果:{'rouge1': 0.45050324572461636, 'rouge2': 0.2010668922579611, 'rougeL': 0.28295192431911953, 'rougeLsum': 0.28295192431911953}
BERT评估指标结果:{'precision': 0.7481734365224838, 'recall': 0.736190888285637, 'f1': 0.7416769295930863}
移动分数:0.6111134514384304
提供机构:
arthurmluz
原始信息汇总
数据集概述
数据集信息
-
特征列表:
id:类型为int64text:类型为stringsummary:类型为stringgen_summary:类型为stringrouge:包含以下子特征rouge1:类型为float64rouge2:类型为float64rougeL:类型为float64rougeLsum:类型为float64
bert:包含以下子特征f1:类型为float64的序列hashcode:类型为stringprecision:类型为float64的序列recall:类型为float64的序列
moverScore:类型为float64
-
数据分割:
validation:包含 20 个样本,总字节数为 99153
-
数据集大小:
- 下载大小:96177 字节
- 实际大小:99153 字节
配置信息
- 默认配置:
- 数据文件路径:
data/validation-*
- 数据文件路径:



