five

NYtimes

收藏
arXiv2025-09-30 收录
下载链接:
http://archive.ics.uci.edu/ml/datasets/Bag+of+Words
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了1987年1月1日至2007年6月19日期间,《纽约时报》发表的新闻稿文章,并附有文章的元数据。为了分析,随机选取了10万篇文章,并移除了低频词汇。该数据集的规模为10万篇抽样文章,其任务是进行主题一致性评估。

This dataset includes news articles published in The New York Times between January 1, 1987 and June 19, 2007, along with their associated metadata. For analytical purposes, 100,000 articles were randomly sampled, and low-frequency terms were removed. This dataset consists of 100,000 sampled articles, with its targeted task being topic coherence evaluation.
提供机构:
New York Times
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作