five

emkr-13/Dataset_Online_News_45000

收藏
Hugging Face2024-05-08 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/emkr-13/Dataset_Online_News_45000
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含来自Detik、Kompas.com和CNN News的新闻文章,数据通过爬虫技术收集,语言为印尼语,数据规模在10M到100M之间。相关爬虫代码可在github用户emkr-13的页面上查看。

该数据集包含来自Detik、Kompas.com和CNN News的新闻文章,数据通过爬虫技术收集,语言为印尼语,数据规模在10M到100M之间。相关爬虫代码可在github用户emkr-13的页面上查看。
提供机构:
emkr-13
原始信息汇总

数据集概述

基本信息

  • 语言: 印尼语 (id)
  • 大小范围: 10M<n<100M

内容来源

  • 数据集名称: Kumpulan Berita dari Detik, Kompas.com dan CNN News
  • 采集方式: 通过网络爬虫技术获取

数据集来源

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作