zedfum/long-summarization-persian
收藏Hugging Face2025-08-20 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/zedfum/long-summarization-persian
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过爬取ensani.ir的所有类别创建的,用于文本摘要任务,语言为波斯语。
This dataset is constructed by crawling all categories of ensani.ir, and is designed for text summarization tasks, with its content in Persian.
提供机构:
zedfum
原始信息汇总
数据集概述
数据集基本信息
- 任务类别: 摘要生成
- 语言: 波斯语(فارسی)
- 数据集大小: 10,000 < n < 100,000
数据集特征
- 特征名称:
- Unnamed: 0 (int64)
- id (string)
- article (string)
- summary (string)
数据集分割
- 训练集:
- 示例数量: 49,478
- 字节数: 2,678,493,527.0838547
- 测试集:
- 示例数量: 2,749
- 字节数: 148,817,225.9580726
- 验证集:
- 示例数量: 2,749
- 字节数: 148,817,225.9580726
数据集大小
- 下载大小: 1,456,639,377字节
- 数据集总大小: 2,976,127,979字节
数据集用途
- 支持任务: 文本摘要生成
- 语言: 波斯语



