pszemraj/scientific_lay_summarisation-elife-norm
收藏Hugging Face2023-04-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pszemraj/scientific_lay_summarisation-elife-norm
下载链接
链接失效反馈官方服务:
资源简介:
这是一个名为scientific_lay_summarisation - elife - normalized的数据集,属于_elife_分割版本。数据集主要用于摘要生成和文本到文本生成任务,语言为英语,规模在10K到100K之间。数据集包含训练集、测试集和验证集,每个集都包含文章、摘要、章节标题、关键词、年份、标题、文章长度和摘要长度等特征。数据集通过Hugging Face的datasets库加载,并提供了加载代码示例。
这是一个名为scientific_lay_summarisation - elife - normalized的数据集,属于_elife_分割版本。数据集主要用于摘要生成和文本到文本生成任务,语言为英语,规模在10K到100K之间。数据集包含训练集、测试集和验证集,每个集都包含文章、摘要、章节标题、关键词、年份、标题、文章长度和摘要长度等特征。数据集通过Hugging Face的datasets库加载,并提供了加载代码示例。
提供机构:
pszemraj
原始信息汇总
数据集概述
基本信息
- 名称: scientific_lay_summarisation - elife - normalized
- 许可证: MIT
- 语言: 英语 (en)
- 大小: 10K<n<100K
- 任务类别:
- 总结 (summarization)
- 文本到文本生成 (text2text-generation)
- 源数据集: tomasg25/scientific_lay_summarisation
数据集结构
- 数据集类型: DatasetDict
- 子集:
- 训练集 (train):
- 特征: [article, summary, section_headings, keywords, year, title, article_length, summary_length]
- 行数: 4346
- 测试集 (test):
- 特征: [article, summary, section_headings, keywords, year, title, article_length, summary_length]
- 行数: 241
- 验证集 (validation):
- 特征: [article, summary, section_headings, keywords, year, title, article_length, summary_length]
- 行数: 241
- 训练集 (train):



