MIND (MIcrosoft News Dataset)
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/MIND
下载链接
链接失效反馈官方服务:
资源简介:
“MIcrosoft News Dataset (MIND) 是一个用于新闻推荐研究的大规模数据集。它是从微软新闻网站的匿名行为日志中收集的。MIND 的使命是作为新闻推荐的基准数据集,并促进新闻推荐和推荐系统领域的研究。MIND包含约16万篇英文新闻文章和100万用户产生的超过1500万条印象日志。每篇新闻文章都包含丰富的文本内容,包括标题、摘要、正文、类别和实体。每条印象日志包含此用户在此印象之前的点击事件、未点击事件和历史新闻点击行为。为保护用户隐私,每个用户在安全散列到匿名 ID 时与生产系统断开链接。"
Microsoft News Dataset (MIND) is a large-scale dataset for news recommendation research. It is collected from anonymous behavioral logs of the Microsoft News website. The mission of MIND is to serve as a benchmark dataset for news recommendation and advance research in the fields of news recommendation and recommender systems. MIND contains approximately 160,000 English news articles and over 15 million impression logs generated by 1 million users. Each news article includes rich textual content, including title, abstract, body, category and entities. Each impression log contains the user's clicked events, unclicked events and historical clicked news behaviors prior to this impression. To protect user privacy, each user is disconnected from the production system when securely hashed into an anonymous ID.
提供机构:
OpenDataLab
创建时间:
2022-04-28
搜集汇总
数据集介绍

背景与挑战
背景概述
MIND是一个用于新闻推荐研究的大规模基准数据集,由微软新闻网站的匿名日志构建而成,包含约16万篇英文新闻文章和100万用户产生的超过1500万条印象日志,每篇文章具有标题、摘要等丰富文本信息,日志记录用户点击行为,旨在促进推荐系统领域的研究。
以上内容由遇见数据集搜集并总结生成



