five

KuaiSAR|搜索推荐系统数据集|用户行为分析数据集

收藏
arXiv2023-08-14 更新2024-06-21 收录
搜索推荐系统
用户行为分析
下载链接:
https://ethan00si.github.io/KuaiSAR/
下载链接
链接失效反馈
资源简介:
KuaiSAR是由高瓴人工智能学院和快手科技联合创建的大型真实世界数据集,专注于整合搜索与推荐行为。该数据集包含25,877名用户在快手平台上的真实交互数据,涵盖搜索和推荐服务的详细行为记录。数据集的创建旨在促进学术界对搜索与推荐服务整合的研究,支持多任务学习、意图推荐等多种研究方向。通过记录用户在搜索和推荐服务间的转换行为,KuaiSAR为研究提供了丰富的数据资源,有助于理解和优化用户在统一搜索与推荐环境中的行为模式。
提供机构:
高瓴人工智能学院 中国人民大学 北京, 中国
创建时间:
2023-06-13
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

Breast Ultrasound Images (BUSI)

小型(约500×500像素)超声图像,适用于良性和恶性病变的分类和分割任务。

github 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录

典型分布式光伏出力预测数据集

光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。

国家基础学科公共科学数据中心 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录