five

Salesforce/summedits

收藏
Hugging Face2026-04-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Salesforce/summedits
下载链接
链接失效反馈
官方服务:
资源简介:
SummEdits数据集包含10个领域的6,348个样本,用于评估摘要的事实一致性。每个样本包含以下字段:`domain`(所属领域)、`id`(唯一标识符)、`doc`(输入文档)、`summary`(与文档事实一致或不一致的摘要)、`label`(摘要是否一致,1表示一致,0表示不一致)、`seed_summary`(作为摘要起点的种子摘要)、`edit_types`(对于不一致的摘要,GPT4分类的错误类型)。

SummEdits数据集包含10个领域的6,348个样本,用于评估摘要的事实一致性。每个样本包含以下字段:`domain`(所属领域)、`id`(唯一标识符)、`doc`(输入文档)、`summary`(与文档事实一致或不一致的摘要)、`label`(摘要是否一致,1表示一致,0表示不一致)、`seed_summary`(作为摘要起点的种子摘要)、`edit_types`(对于不一致的摘要,GPT4分类的错误类型)。
提供机构:
Salesforce
原始信息汇总

SummEdits 数据集概述

基本信息

  • 许可证: cc-by-4.0
  • 任务类别:
    • 文本分类
    • 摘要生成
  • 语言: 英语
  • 标签:
    • 生物学
    • 金融
    • 法律
    • 医学
  • 名称: SummEdits
  • 数据规模: 1K<n<10K

数据集详情

  • 样本数量: 6,348 个样本
  • 领域: 10 个不同领域
  • 样本结构:
    • domain: 样本所属领域
    • id: 样本唯一ID
    • doc: 输入文档
    • summary: 与文档事实一致或不一致的摘要
    • label: 摘要事实一致性标签(1表示一致,0表示不一致)
    • seed_summary: 作为摘要起点的(一致)种子摘要
    • edit_types: 不一致摘要的错误类型(由GPT4分类)
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作