arthurmluz/cstnews_data-wiki_gptextsum2_results
收藏Hugging Face2023-11-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/arthurmluz/cstnews_data-wiki_gptextsum2_results
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: text
dtype: string
- name: summary
dtype: string
- name: gen_summary
dtype: string
- name: rouge
struct:
- name: rouge1
dtype: float64
- name: rouge2
dtype: float64
- name: rougeL
dtype: float64
- name: rougeLsum
dtype: float64
- name: bert
struct:
- name: f1
sequence: float64
- name: hashcode
dtype: string
- name: precision
sequence: float64
- name: recall
sequence: float64
- name: moverScore
dtype: float64
splits:
- name: validation
num_bytes: 58503
num_examples: 16
download_size: 55642
dataset_size: 58503
configs:
- config_name: default
data_files:
- split: validation
path: data/validation-*
---
# Dataset Card for "cstnews_data-wiki-gptextsum_results"
rouge= {'rouge1': 0.5311006728849477, 'rouge2': 0.2905368258729071, 'rougeL': 0.36045460975092747, 'rougeLsum': 0.36045460975092747}
bert= {'precision': 0.7722661904990673, 'recall': 0.793611966073513, 'f1': 0.7823329381644726}
mover = 0.6376306490265851
数据集信息:
特征字段:
- 字段名:id,数据类型:字符串
- 字段名:text,数据类型:字符串
- 字段名:summary,数据类型:字符串
- 字段名:gen_summary,数据类型:字符串
- 字段名:rouge,为结构体,包含以下子字段:
- 子字段名:rouge1,数据类型:双精度浮点数(float64)
- 子字段名:rouge2,数据类型:双精度浮点数(float64)
- 子字段名:rougeL,数据类型:双精度浮点数(float64)
- 子字段名:rougeLsum,数据类型:双精度浮点数(float64)
- 字段名:bert,为结构体,包含以下子字段:
- 子字段名:f1,数据类型:双精度浮点数序列
- 子字段名:hashcode,数据类型:字符串
- 子字段名:precision,数据类型:双精度浮点数序列
- 子字段名:recall,数据类型:双精度浮点数序列
- 字段名:moverScore,数据类型:双精度浮点数
数据集划分:
- 划分名称:验证集(validation),占用字节数:58503,样本数量:16
下载大小:55642
数据集总大小:58503
配置项:
- 配置名称:默认配置(default),数据文件:
- 对应数据集划分:验证集(validation)
- 文件路径:data/validation-*
# 「cstnews_data-wiki-gptextsum_results」数据集卡片
ROUGE指标结果:{'rouge1': 0.5311006728849477, 'rouge2': 0.2905368258729071, 'rougeL': 0.36045460975092747, 'rougeLsum': 0.36045460975092747}
BERT指标结果:{'precision': 0.7722661904990673, 'recall': 0.793611966073513, 'f1': 0.7823329381644726}
MoverScore得分:0.6376306490265851
提供机构:
arthurmluz
原始信息汇总
数据集概述
数据集信息
特征
- id: 字符串类型
- text: 字符串类型
- summary: 字符串类型
- gen_summary: 字符串类型
- rouge: 结构体类型,包含以下字段:
- rouge1: 浮点数类型
- rouge2: 浮点数类型
- rougeL: 浮点数类型
- rougeLsum: 浮点数类型
- bert: 结构体类型,包含以下字段:
- f1: 浮点数序列类型
- hashcode: 字符串类型
- precision: 浮点数序列类型
- recall: 浮点数序列类型
- moverScore: 浮点数类型
数据分割
- validation: 包含58503字节,16个样本
数据集大小
- 下载大小: 55642字节
- 数据集大小: 58503字节
配置
- default: 包含验证集文件路径
data/validation-*
评估指标
- rouge:
- rouge1: 0.5311
- rouge2: 0.2905
- rougeL: 0.3605
- rougeLsum: 0.3605
- bert:
- precision: 0.7723
- recall: 0.7936
- f1: 0.7823
- moverScore: 0.6376
搜集汇总
数据集介绍

构建方式
在自然语言处理领域,文本摘要任务对高质量数据的需求日益增长。该数据集基于CSTNews语料库,通过GPT模型生成摘要,并整合了维基百科相关文本以增强上下文信息。构建过程中,原始新闻文本与生成摘要被精确对齐,同时引入了ROUGE、BERTScore及MoverScore等多维度自动评估指标,形成结构化数据记录。这一流程确保了数据的一致性与可追溯性,为摘要生成研究提供了可靠的基准资源。
使用方法
在文本摘要与自然语言生成的研究中,该数据集可直接用于模型训练、验证与评估。用户可通过加载标准数据分割(如验证集)访问文本、摘要及各项评估分数。数据集支持基于ROUGE、BERTScore等指标进行性能对比,亦可用于开发新的评估方法或复现现有研究。其结构化格式便于集成至主流机器学习框架,加速实验流程并促进结果的可重复性。
背景与挑战
背景概述
在自然语言处理领域,文本摘要技术旨在从冗长文档中提取核心信息,生成简洁且语义连贯的摘要。数据集'arthurmluz/cstnews_data-wiki_gptextsum2_results'由研究人员或机构于近期构建,专注于评估生成式摘要模型的性能。该数据集通过整合新闻文本与对应的人工摘要及模型生成摘要,并引入ROUGE、BERTScore和MoverScore等多维度评估指标,为核心研究问题——即如何客观量化摘要质量与语义保真度——提供了实证基础。其创建推动了自动摘要评估方法的标准化进程,对提升模型的可解释性与可靠性具有显著影响力。
当前挑战
该数据集致力于解决文本自动摘要领域的评估挑战,即传统基于n-gram重叠的度量方法(如ROUGE)难以全面捕捉语义相似性与连贯性。具体而言,构建过程中面临多维度评估指标的统一整合难题,需协调ROUGE、BERTScore和MoverScore等异构度量标准,确保其计算一致性与可比性。同时,数据采集与标注需平衡新闻文本的多样性与摘要质量的人工校验,以避免评估偏差。此外,生成摘要与参考摘要之间的深层语义对齐亦构成技术瓶颈,要求评估框架既能反映表面重叠,又能涵盖语义分布与信息完整性。
常用场景
经典使用场景
在自然语言处理领域,文本摘要生成是提升信息检索与知识压缩效率的关键任务。该数据集通过提供原始文本、人工摘要及生成摘要的对比,辅以ROUGE、BERTScore和MoverScore等多维度评估指标,为摘要模型的训练与验证提供了标准化基准。研究者可借此评估生成式模型在保持语义一致性与语言流畅性方面的表现,推动自动摘要技术向更精准、更人性化的方向发展。
解决学术问题
该数据集有效应对了文本摘要研究中评估标准单一化与主观性过强的学术困境。通过整合基于n-gram重叠度的ROUGE指标、基于语义嵌入的BERTScore以及考虑词汇分布相似性的MoverScore,构建了多层次、多角度的自动化评估体系。这不仅缓解了人工评价成本高昂的问题,还为模型优化提供了可量化的改进方向,促进了摘要生成技术在语义保真度与信息密度平衡方面的理论突破。
实际应用
在实际应用层面,该数据集支撑的摘要技术已渗透到新闻聚合、智能助理与教育资料精炼等多个场景。例如,媒体机构可借助基于该数据集训练的模型,快速生成新闻事件的要点摘要,提升内容分发效率;在线教育平台则能自动化提炼长篇教材的核心知识,辅助学习者高效聚焦关键信息。这些应用显著降低了信息过载带来的认知负担,推动了人机交互体验的智能化升级。
数据集最近研究
最新研究方向
在文本摘要生成领域,基于预训练语言模型的数据集构建与评估正成为前沿焦点。该数据集整合了原始文本、人工摘要及生成摘要,并引入ROUGE、BERTScore与MoverScore等多维度评估指标,为生成模型的细粒度性能分析提供了结构化基准。当前研究热点集中于利用此类数据优化摘要的语义一致性与事实准确性,特别是在新闻领域,以应对生成内容可能存在的偏差问题。这一方向推动了摘要评估从表面匹配向深层语义对齐的演进,对提升自动摘要的可靠性与实用性具有重要影响。
以上内容由遇见数据集搜集并总结生成



