arbml/AraSum
收藏Hugging Face2024-07-15 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/arbml/AraSum
下载链接
链接失效反馈官方服务:
资源简介:
AraSum数据集是一个针对阿拉伯语文本摘要的任务的数据集。它包含了训练集,但没有提供具体的数据集描述、支持的任务、语言等信息。数据集的特征包括索引、摘要和文章正文。训练集共有49603个样本,大小为220838984字节。
The AraSum dataset is a dataset for the Arabic text summarization task. It includes a training set, but no specific dataset description, supported tasks, languages, and other information are provided. The features of the dataset include index, summary, and article text. The training set consists of 49,603 samples with a size of 220,838,984 bytes.
提供机构:
arbml
原始信息汇总
数据集概述
数据集名称
- AraSum
数据集描述
- 数据集摘要: [更多信息待补充]
- 支持的任务和排行榜: [更多信息待补充]
- 语言: [更多信息待补充]
数据集结构
- 数据实例: [更多信息待补充]
- 数据字段: [更多信息待补充]
- 数据分割: [更多信息待补充]
数据集创建
- 数据收集和规范化: [更多信息待补充]
- 源语言生产者: [更多信息待补充]
- 注释过程: [更多信息待补充]
- 注释者: [更多信息待补充]
- 个人和敏感信息: [更多信息待补充]
使用数据的考虑
- 数据集的社会影响: [更多信息待补充]
- 偏见讨论: [更多信息待补充]
- 其他已知限制: [更多信息待补充]
附加信息
- 数据集管理者: [更多信息待补充]
- 许可信息: [更多信息待补充]
- 引用信息:
@inproceedings{kahla-etal-2021-cross, title = "Cross-lingual Fine-tuning for Abstractive {A}rabic Text Summarization", author = "Kahla, Mram and Yang, Zijian Gy{H{o}}z{H{o}} and Nov{a}k, Attila", booktitle = "Proceedings of the International Conference on Recent Advances in Natural Language Processing (RANLP 2021)", month = sep, year = "2021", address = "Held Online", publisher = "INCOMA Ltd.", url = "https://aclanthology.org/2021.ranlp-1.74", pages = "655--663", }
- 贡献者: 感谢 @github-username 添加此数据集。



