five

Video Recommendation Dataset

收藏
github2024-12-06 更新2024-12-10 收录
下载链接:
https://github.com/Tim-Alpha/video-recommendation-assignment
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含用户交互和视频元数据,可以通过提供的API获取。数据集包括用户查看、点赞、启发、评分和所有视频的详细信息。

This dataset comprises user interaction data and video metadata, which is accessible via the provided API. It encompasses detailed records of user views, likes, inspirational interactions, ratings, as well as comprehensive details for all videos included in the dataset.
创建时间:
2024-11-11
原始信息汇总

🎥 Video Recommendation Algorithm Assignment

🎯 Objective

设计一个推荐算法,根据用户偏好和互动模式推荐视频。该算法通过利用用户交互数据和视频元数据,提供个性化的视频推荐。

📊 Dataset

数据集可以通过以下API获取,这些API提供用户交互和视频元数据的信息:

APIs

  1. 获取所有已查看的帖子 (METHOD: GET):

    https://api.socialverseapp.com/posts/view?page=1&page_size=1000&resonance_algorithm=resonance_algorithm_cjsvervb7dbhss8bdrj89s44jfjdbsjd0xnjkbvuire8zcjwerui3njfbvsujc5if

  2. 获取所有已点赞的帖子 (METHOD: GET):

    https://api.socialverseapp.com/posts/like?page=1&page_size=1000&resonance_algorithm=resonance_algorithm_cjsvervb7dbhss8bdrj89s44jfjdbsjd0xnjkbvuire8zcjwerui3njfbvsujc5if

  3. 获取所有受启发的帖子 (METHOD: GET):

    https://api.socialverseapp.com/posts/inspire?page=1&page_size=1000&resonance_algorithm=resonance_algorithm_cjsvervb7dbhss8bdrj89s44jfjdbsjd0xnjkbvuire8zcjwerui3njfbvsujc5if

  4. 获取所有已评级的帖子 (METHOD: GET):

    https://api.socialverseapp.com/posts/rating?page=1&page_size=1000&resonance_algorithm=resonance_algorithm_cjsvervb7dbhss8bdrj89s44jfjdbsjd0xnjkbvuire8zcjwerui3njfbvsujc5if

  5. 获取所有帖子 (需要Header*) (METHOD: GET):

    https://api.socialverseapp.com/posts/summary/get?page=1&page_size=1000

  6. 获取所有用户 (需要Header*) (METHOD: GET):

    https://api.socialverseapp.com/users/get_all?page=1&page_size=1000

Authorization

在API请求中传递Flic-Token作为Header进行授权: json "Flic-Token": "flic_6e2d8d25dc29a4ddd382c2383a903cf4a688d1a117f6eb43b35a1e7fadbb84b8"

Requirements

  1. 个性化: 推荐算法应根据用户历史和互动模式进行个性化推荐。
  2. 冷启动问题处理: 包含一种机制,为没有先前交互历史的新用户推荐视频(提示:可以使用用户情绪)。

🛠️ Specific Tasks

1. 数据预处理

  • 使用提供的API检索和预处理视频元数据和用户交互数据。
  • 处理缺失值,规范化数据,并根据需要创建派生特征以供推荐模型使用。

2. 算法开发

  • 使用以下方法开发推荐算法:
    • 基于内容的过滤: 推荐与用户已查看或点赞的视频相似的视频。
    • 协同过滤: 利用相似用户的偏好来增强推荐。
    • 混合模型: 结合基于内容和协同过滤以提高准确性。
  • 说明模型选择并描述其如何满足项目目标。

3. 评估指标

  • 实施指标以衡量推荐质量,例如:
    • 平均绝对误差 (MAE):
    • 均方根误差 (RMSE):
  • 总结结果和从指标评估中获得的见解。

4. 文档

  • 提供清晰、逐步的文档,包括方法、模型架构和开发过程中做出的关键决策。
  • 创建3个API端点,提供usernamecategory_idmood
  • 端点应如下所示(在单个API调用中返回推荐给用户的10个帖子):
    • http://localhost:port_no/feed?username=your_username&category_id=category_id_user_want_to_see&mood=user_current_mood
    • http://localhost:port_no/feed?username=your_username&category_id=category_id_user_want_to_see
    • http://localhost:port_no/feed?username=your_username
搜集汇总
数据集介绍
main_image_url
构建方式
在构建视频推荐数据集时,采用了从多个API端点获取数据的方法。具体而言,通过调用'Get All Viewed Posts'、'Get All Liked Posts'、'Get All Inspired Posts'、'Get All Rated Posts'、'Get All Posts'以及'Get All Users'等API,收集用户与视频的互动数据以及视频的元数据。这些API支持分页请求,确保数据获取的效率和避免重复。此外,数据集的构建还涉及对缺失值的处理、数据标准化以及特征衍生等预处理步骤,以确保数据的质量和适用性。
使用方法
使用该视频推荐数据集时,首先需通过提供的API端点获取数据,并进行必要的预处理。随后,可以根据用户的历史互动数据和视频元数据,采用内容过滤、协同过滤或混合模型等推荐算法进行模型训练。在模型开发过程中,应特别关注冷启动问题的处理,利用用户情绪等额外信息进行推荐。最终,通过实现评估指标如均方根误差(RMSE)和平均绝对误差(MAE)来衡量推荐质量,并根据结果进行模型优化。此外,数据集还支持通过API调用进行实时推荐,用户可以根据用户名、类别ID和情绪等参数获取个性化视频推荐。
背景与挑战
背景概述
视频推荐数据集(Video Recommendation Dataset)由Empowerverse App团队创建,旨在支持个性化视频推荐算法的研究与开发。该数据集通过API接口提供用户交互数据和视频元数据,涵盖用户观看、点赞、启发和评分等多维度信息。其核心研究问题在于如何利用这些数据构建高效且个性化的推荐系统,以提升用户体验。该数据集的创建不仅推动了推荐算法领域的技术进步,也为相关应用提供了实践基础。
当前挑战
视频推荐数据集面临的主要挑战包括数据获取与处理的复杂性,特别是通过API分页获取数据时需避免重复数据的问题。此外,个性化推荐算法需解决冷启动问题,即如何为新用户提供有效推荐。算法开发中需平衡内容过滤与协同过滤的结合,确保推荐质量。最后,数据集的评估需采用多维度指标,如均方根误差(RMSE)和平均绝对误差(MAE),以全面衡量推荐系统的性能。
常用场景
经典使用场景
在视频推荐领域,Video Recommendation Dataset 被广泛用于开发和评估个性化推荐算法。该数据集通过API接口获取用户与视频的交互数据,包括观看、点赞、启发和评分等行为,以及视频的元数据。研究者利用这些数据,结合内容过滤、协同过滤和混合模型等技术,构建能够根据用户历史行为和偏好进行精准推荐的算法。
解决学术问题
Video Recommendation Dataset 解决了推荐系统中的核心问题,如冷启动问题和个性化推荐。通过提供丰富的用户交互数据和视频元数据,该数据集帮助研究者开发出能够有效处理新用户推荐问题的算法,并提升推荐系统的准确性和用户满意度。此外,该数据集还促进了推荐算法在实际应用中的性能评估和优化。
实际应用
在实际应用中,Video Recommendation Dataset 被用于开发和优化各种视频平台的推荐系统,如社交媒体、在线教育和娱乐平台。通过分析用户行为和视频内容,这些平台能够提供更加精准和个性化的视频推荐,从而提高用户参与度和满意度。此外,该数据集还支持企业进行用户行为分析和市场研究,以制定更有效的内容策略。
数据集最近研究
最新研究方向
在视频推荐领域,最新的研究方向聚焦于如何通过深度学习和强化学习技术提升推荐系统的个性化和准确性。研究者们正致力于开发混合推荐模型,结合内容过滤和协同过滤的优点,以更好地捕捉用户兴趣和行为模式。此外,针对冷启动问题,研究者们提出利用用户情绪和上下文信息进行初始推荐,从而在用户无历史交互数据的情况下提供有价值的推荐。这些研究不仅提升了用户体验,还为视频平台的用户留存和活跃度带来了显著的积极影响。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作