five

Corpus of News on the Web (NOW)

收藏
Abacus2025-01-04 收录
下载链接:
https://abacus.library.ubc.ca/dataset.xhtml?persistentId=hdl:11272.1/AB2/SBY9NU
下载链接
链接失效反馈
官方服务:
资源简介:
Davies, Mark, 2022, "Corpus of News on the Web (NOW)", https://hdl.handle.net/11272.1/AB2/SBY9NU, Abacus Data Network, V2

马克·戴维斯(Mark Davies),2022,《网络新闻语料库(Corpus of News on the Web,NOW)》,持久标识符:https://hdl.handle.net/11272.1/AB2/SBY9NU,Abacus数据网络(Abacus Data Network),版本V2
提供机构:
Restricted data
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Corpus of News on the Web (NOW)是一个大规模的英语新闻文本数据集,包含2010年至2022年间20个英语国家的在线报纸和杂志的157亿词数据,每月新增约1.8-2亿词。该数据集专为学术研究设计,使用受到严格限制。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作