five

pszemraj/summcomparer-gauntlet-v0p1

收藏
Hugging Face2023-05-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pszemraj/summcomparer-gauntlet-v0p1
下载链接
链接失效反馈
官方服务:
资源简介:
SummComparer数据集用于比较不同模型在生成摘要方面的表现。数据集包含两个主要文件:`input_documents.parquet`和`gauntlet_summaries.parquet`,分别存储原始文档和生成的摘要。数据集主要用于分析摘要质量,而不是用于训练模型。此外,数据集中包含由GPT-4和GPT-3.5-turbo生成的参考摘要,这些内容受OpenAI使用条款的约束。

SummComparer数据集用于比较不同模型在生成摘要方面的表现。数据集包含两个主要文件:`input_documents.parquet`和`gauntlet_summaries.parquet`,分别存储原始文档和生成的摘要。数据集主要用于分析摘要质量,而不是用于训练模型。此外,数据集中包含由GPT-4和GPT-3.5-turbo生成的参考摘要,这些内容受OpenAI使用条款的约束。
提供机构:
pszemraj
原始信息汇总

数据集概述

基本信息

  • 名称: SummComparer - v0.1 version
  • 许可证: cc-by-4.0
  • 任务类别: 摘要生成
  • 语言: 英语
  • 标签: gauntlet
  • 大小: 1K<n<10K

数据集描述

  • 目的: 用于分析不同模型的摘要质量,而非用于训练新模型。
  • 内容: 包含原始文档和相应的摘要输出,用于比较分析。

数据集结构

  • 文件:
    • input_documents.parquet: 包含原始文档及其元数据。
    • gauntlet_summaries.parquet: 包含摘要输出及其相关模型参数。
  • 数据集加载: python from datasets import load_dataset dataset = load_dataset("pszemraj/summcomparer-gauntlet-v0p1")

使用注意事项

  • 数据状态: 当前版本的数据集仍处于“原始”格式,已进行基本清理,但可能需要进一步处理。
  • 版权声明: 数据集包含由GPT-4和GPT-3.5-turbo生成的参考摘要,使用时需遵守OpenAI的条款。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作