【我遇到的问题】 • 现象:该数据集的下载链接已失效 【相关信息】 • 可考虑访问这个链接获取类似文件~https://www.selectdataset.com/dataset/3688356173feccbcf1f1e490ddc6bc72
MemeTracker
收藏OpenDataLab2026-05-10 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/MemeTracker
下载链接
链接失效反馈官方服务:
资源简介:
“来自 Memetracker 的 9600 万个模因。Memetracker 跟踪在整个在线新闻范围内随时间最频繁出现的引语和短语。这使得可以看到每天不同的故事如何竞争新闻和博客报道,以及如何某些故事持续存在,而另一些则迅速消失。总体而言,Memetracker 跟踪了超过 1700 万个不同的短语,其中大约 54% 的短语/引用提及出现在 blos 上,46% 出现在新闻媒体中。
This dataset comprises 96 million memes from Memetracker. Memetracker tracks the most frequently occurring quotes and phrases across the entire online news landscape over time. This allows researchers to observe how distinct news stories compete for coverage across news and blog platforms on a daily basis, as well as the varying lifecycles of these stories: some persist over extended periods while others quickly fade from public attention. Overall, Memetracker monitors over 17 million distinct phrases, with approximately 54% of these phrases or quotes appearing on blogs, and 46% appearing in news media.
提供机构:
OpenDataLab
创建时间:
2022-04-29
搜集汇总
数据集介绍

背景与挑战
背景概述
MemeTracker是一个由斯坦福大学、Facebook AI Research和康奈尔大学于2009年发布的文本数据集,包含9600万个模因(即高频引语和短语),用于追踪在线新闻和博客中短语的传播动态,分析新闻周期变化。数据集规模为36.7GB,涵盖新闻和博客两种媒体来源,适用于自然语言处理和推荐系统研究。
以上内容由遇见数据集搜集并总结生成



