five

msduran/summarization_dataset

收藏
Hugging Face2024-05-21 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/msduran/summarization_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: title dtype: string - name: authors dtype: string - name: date dtype: string - name: topics dtype: string - name: content dtype: string - name: summary dtype: string - name: paragraphs dtype: string - name: headlines dtype: string - name: language dtype: string - name: link dtype: string - name: __index_level_0__ dtype: int64 splits: - name: validation_turkish num_bytes: 4288295 num_examples: 1000 - name: validation_english num_bytes: 17226573 num_examples: 1000 download_size: 13025488 dataset_size: 21514868 configs: - config_name: default data_files: - split: validation_turkish path: data/validation_turkish-* - split: validation_english path: data/validation_english-* language: - tr - en task_categories: - summarization ---
提供机构:
msduran
原始信息汇总

数据集概述

数据集特征

  • title:字符串类型
  • authors:字符串类型
  • date:字符串类型
  • topics:字符串类型
  • content:字符串类型
  • summary:字符串类型
  • paragraphs:字符串类型
  • headlines:字符串类型
  • language:字符串类型
  • link:字符串类型
  • index_level_0:整数类型

数据集划分

  • validation_turkish
    • 字节数:4288295
    • 示例数:1000
  • validation_english
    • 字节数:17226573
    • 示例数:1000

数据集大小

  • 下载大小:13025488字节
  • 数据集总大小:21514868字节

语言

  • 土耳其语 (tr)
  • 英语 (en)

任务类别

  • 摘要生成 (summarization)
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作