msduran/summarization_dataset
收藏Hugging Face2024-05-21 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/msduran/summarization_dataset
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: title
dtype: string
- name: authors
dtype: string
- name: date
dtype: string
- name: topics
dtype: string
- name: content
dtype: string
- name: summary
dtype: string
- name: paragraphs
dtype: string
- name: headlines
dtype: string
- name: language
dtype: string
- name: link
dtype: string
- name: __index_level_0__
dtype: int64
splits:
- name: validation_turkish
num_bytes: 4288295
num_examples: 1000
- name: validation_english
num_bytes: 17226573
num_examples: 1000
download_size: 13025488
dataset_size: 21514868
configs:
- config_name: default
data_files:
- split: validation_turkish
path: data/validation_turkish-*
- split: validation_english
path: data/validation_english-*
language:
- tr
- en
task_categories:
- summarization
---
提供机构:
msduran
原始信息汇总
数据集概述
数据集特征
- title:字符串类型
- authors:字符串类型
- date:字符串类型
- topics:字符串类型
- content:字符串类型
- summary:字符串类型
- paragraphs:字符串类型
- headlines:字符串类型
- language:字符串类型
- link:字符串类型
- index_level_0:整数类型
数据集划分
- validation_turkish:
- 字节数:4288295
- 示例数:1000
- validation_english:
- 字节数:17226573
- 示例数:1000
数据集大小
- 下载大小:13025488字节
- 数据集总大小:21514868字节
语言
- 土耳其语 (tr)
- 英语 (en)
任务类别
- 摘要生成 (summarization)



