five

新闻推荐数据集|新闻推荐数据集|推荐系统数据集

收藏
阿里云天池2025-12-12 更新2024-07-22 收录
新闻推荐
推荐系统
下载链接:
https://tianchi.aliyun.com/dataset/183569
下载链接
链接失效反馈
资源简介:
新闻推荐数据集 赛题以预测用户未来点击新闻文章为任务,数据集报名后可见并可下载,该数据来自某新闻APP平台的用户交互数据,包括30万用户,近300万次点击,共36万多篇不同的新闻文章,同时每篇新闻文章有对应的embedding向量表示。为了保证比赛的公平性,将会从中抽取20万用户的点击日志数据作为训练集,5万用户的点击日志数据作为测试集A,5万用户的点击日志数据作为测试集B。 train_click_log.csv:训练集用户点击日志 testA_click_log.csv:测试集用户点击日志 articles.csv:新闻文章信息数据表 articles_emb.csv:新闻文章embedding向量表示 sample_submit.csv:提交样例文件 user_id 用户id click_article_id 点击文章id click_timestamp 点击时间戳 click_environment 点击环境 click_deviceGroup 点击设备组 click_os 点击操作系统 click_country 点击城市 click_region 点击地区 click_referrer_type 点击来源类型 article_id 文章id,与click_article_id相对应 category_id 文章类型id created_at_ts 文章创建时间戳 words_count 文章字数 emb_1,emb_2,...,emb_249 文章embedding向量表示
提供机构:
阿里云天池
创建时间:
2024-07-21
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
5,000+
优质数据集
54 个
任务类型
进入经典数据集