five

MohamedZayton/AMINA

收藏
Hugging Face2024-07-03 更新2024-06-25 收录
下载链接:
https://hf-mirror.com/datasets/MohamedZayton/AMINA
下载链接
链接失效反馈
官方服务:
资源简介:
AMINA Newspaper Articles Dataset是一个阿拉伯语的多用途新闻文章数据集,包含来自多个知名新闻来源的文章,如Youm7、BBC、CNN、RT、Elsharq、ElRai、Elspahe和Hespress。该数据集旨在促进自然语言处理、新闻学等领域的研究。每个新闻来源的文章都有详细的属性描述,如标题、文章内容、文章分类、作者、发布日期等。此外,部分文章还附有相关图像。

AMINA Newspaper Articles Dataset是一个阿拉伯语的多用途新闻文章数据集,包含来自多个知名新闻来源的文章,如Youm7、BBC、CNN、RT、Elsharq、ElRai、Elspahe和Hespress。该数据集旨在促进自然语言处理、新闻学等领域的研究。每个新闻来源的文章都有详细的属性描述,如标题、文章内容、文章分类、作者、发布日期等。此外,部分文章还附有相关图像。
提供机构:
MohamedZayton
原始信息汇总

AMINA Newspaper Articles Dataset

概述

AMINA : An Arabic Multi-Purpose Integral News Articles Dataset 是一个从多个知名新闻源收集的综合性文章数据集。该数据集旨在促进自然语言处理和新闻学研究等领域的发展。文章来源包括:

  • Youm7
  • BBC
  • CNN
  • RT
  • Elsharq
  • ElRai
  • Elspahe
  • Hespress

下载指南

使用以下代码片段可以下载和使用各来源的文章数据:

python from datasets import load_dataset

BBC articles

bbc = load_dataset("MohamedZayton/AMINA", data_files="BBC/BBC.csv")

CNN articles

cnn = load_dataset("MohamedZayton/AMINA", data_files="CNN/CNN.csv")

RT articles

rt = load_dataset("MohamedZayton/AMINA", data_files="RT/RT.csv")

Youm7 articles

youm_7 = load_dataset("MohamedZayton/AMINA", data_files="Youm7/Youm7.csv")

Hespress articles

hespress = load_dataset("MohamedZayton/AMINA", data_files="Hespress/Hespress.csv")

Elspahe articles

elspahe = load_dataset("MohamedZayton/AMINA", data_files="Elspahe/Elspahe.csv")

ElRai articles by category

elrai_category_name = load_dataset("MohamedZayton/AMINA", data_files="ElRai/{category_name}.csv")

ElSharq articles by category

elsharq_category_name = load_dataset("MohamedZayton/AMINA", data_files="ElSharq/{category_name}.csv")

图片链接

部分Youm7和Elsharq报纸文章的图片链接:图片链接

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作