News Aggregator Dataset
收藏阿里云天池2026-05-15 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/29993
下载链接
链接失效反馈官方服务:
资源简介:
News are grouped into clusters that represent pages discussing the same news story.
The dataset includes also references to web pages that, at the access time, pointed (has a link to) one of the news page in the collection.
提供机构:
阿里云天池
创建时间:
2019-07-25
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含422,937个新闻页面,按商业、科技、健康等类别分组,并形成代表同一新闻故事的集群。此外,它还提供了15,516个两页浏览会话的引用,这些会话指向集合中的新闻页面,覆盖了946个不同集群。
以上内容由遇见数据集搜集并总结生成



