five

pszemraj/scientific_lay_summarisation-elife-norm

收藏
Hugging Face2023-04-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pszemraj/scientific_lay_summarisation-elife-norm
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个名为scientific_lay_summarisation - elife - normalized的数据集,属于_elife_分割版本。数据集主要用于摘要生成和文本到文本生成任务,语言为英语,规模在10K到100K之间。数据集包含训练集、测试集和验证集,每个集都包含文章、摘要、章节标题、关键词、年份、标题、文章长度和摘要长度等特征。数据集通过Hugging Face的datasets库加载,并提供了加载代码示例。

这是一个名为scientific_lay_summarisation - elife - normalized的数据集,属于_elife_分割版本。数据集主要用于摘要生成和文本到文本生成任务,语言为英语,规模在10K到100K之间。数据集包含训练集、测试集和验证集,每个集都包含文章、摘要、章节标题、关键词、年份、标题、文章长度和摘要长度等特征。数据集通过Hugging Face的datasets库加载,并提供了加载代码示例。
提供机构:
pszemraj
原始信息汇总

数据集概述

基本信息

  • 名称: scientific_lay_summarisation - elife - normalized
  • 许可证: MIT
  • 语言: 英语 (en)
  • 大小: 10K<n<100K
  • 任务类别:
    • 总结 (summarization)
    • 文本到文本生成 (text2text-generation)
  • 源数据集: tomasg25/scientific_lay_summarisation

数据集结构

  • 数据集类型: DatasetDict
  • 子集:
    • 训练集 (train):
      • 特征: [article, summary, section_headings, keywords, year, title, article_length, summary_length]
      • 行数: 4346
    • 测试集 (test):
      • 特征: [article, summary, section_headings, keywords, year, title, article_length, summary_length]
      • 行数: 241
    • 验证集 (validation):
      • 特征: [article, summary, section_headings, keywords, year, title, article_length, summary_length]
      • 行数: 241
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作