val.jsonl

github2025-05-11 更新2025-05-15 收录

下载链接：

https://github.com/Lin-yi-er/ChuangZhiPE

下载链接

链接失效反馈

官方服务：

资源简介：

数据集包含用户编号、用户历史观看电影列表（按时间顺序排列，越靠后表示越近期观看）、用户实际观看的下一部电影以及推荐系统召回阶段得到的候选电影列表。

The dataset consists of user IDs, the chronologically ordered list of movies the user has previously watched (with later entries indicating more recently viewed content), the next movie the user actually watched, and the candidate movie list obtained during the recall stage of the recommendation system.

创建时间：

2025-05-11

原始信息汇总

上海创智学院2025年PE考试数据集概述

数据集基本信息

用途说明：仅供学习和交流
数据文件：val.jsonl
安装依赖：pip install openai

数据结构

python { "user_id": 5737, // 用户编号 "item_list": [ // 用户历史观看电影列表，按时间顺序排列 [1836, "Last Days of Disco, The"], // [电影ID, 电影名称] [3565, "Where the Heart Is"], // ... ], "target_item": [1893, "Beyond Silence"], // 用户实际观看的下一部电影 "candidates": [ // 推荐系统召回阶段得到的候选电影列表 [2492, "20 Dates"], [684, "Windows"], [1893, "Beyond Silence"], // 包含用户实际观看的下一部电影 // ... ] }

评估配置

超参数：
- api_key: str (必须提供)
- base_url: str (默认https://api.deepseek.com)
- model_name: str (默认deepseek-chat)
- num_epochs: int (默认5)
- temperature: float (默认0.0)
- ndcg@k: int (默认k=10)
- is_multi_turn: bool (默认False)

评估方法

执行命令： bash bash eval.sh

或 python python eval.py --api_key <your_api_key> --model_name <your_model_name> --num_epochs <your_num_epochs> --temperature <your_temperature> --ndcg@k your_ndcg@k --is_multi_turn <your_is_multi_turn>

评估结果(NDCG@10)

Epoch	平均NDCG@10
1	0.60508
2	0.66818
3	0.66201
4	0.66376
5	0.60946
最终结果	0.64170

搜集汇总

数据集介绍

构建方式

在电影推荐系统研究领域，val.jsonl数据集通过精心设计的结构捕捉用户观影行为。该数据集采用JSON Lines格式存储，每条记录包含用户编号、按时间排序的历史观影列表、实际观看的下一部电影以及系统生成的候选电影列表。数据构建过程中，电影ID与名称被精确匹配，候选列表中刻意包含用户真实选择以评估推荐准确性。

特点

该数据集展现出鲜明的时序特征与推荐系统评估特性。用户历史观影列表严格按时间顺序排列，有效反映兴趣演化轨迹。候选电影列表包含目标项的设计，为推荐算法性能评估提供基准。数据格式简洁规范，电影ID与名称的映射关系确保信息完整性，适合用于下一项推荐等时序预测任务。

使用方法

针对该数据集的应用需结合OpenAI API进行模型训练与评估。使用者可通过修改prompt_and_parse.py中的提示模板调整推荐策略，利用eval.sh脚本配置超参数包括API密钥、模型名称及训练轮数等。评估阶段采用NDCG@10指标，系统会输出每轮训练的详细得分及最终平均结果，为推荐算法优化提供量化依据。

背景与挑战

背景概述

val.jsonl数据集由上海创智学院于2025年构建，旨在推动个性化推荐系统的研究与发展。该数据集聚焦于电影推荐领域，通过记录用户历史观影记录及候选电影列表，为推荐算法提供丰富的训练与验证数据。其核心研究问题在于如何基于用户历史行为精准预测下一部可能观看的电影，从而提升推荐系统的准确性与用户满意度。该数据集的发布为推荐系统领域的研究者提供了宝贵的实验数据，推动了基于深度学习的推荐算法研究。

当前挑战

该数据集面临的挑战主要体现在两个方面：在领域问题层面，电影推荐系统需要解决用户兴趣的动态变化与稀疏性问题，如何从有限的用户历史行为中挖掘深层偏好是一大难点；在构建过程层面，数据收集涉及用户隐私保护问题，且需确保候选电影列表的多样性与代表性，避免引入选择偏差。此外，评估指标NDCG@10的计算对候选电影的排序敏感性较高，如何平衡准确性与计算效率也是实际应用中的关键挑战。

常用场景

经典使用场景

在推荐系统领域，val.jsonl数据集以其独特的用户历史行为记录和目标推荐项设计，成为评估序列推荐算法性能的经典基准。该数据集通过模拟真实场景中的用户观影序列，为研究者提供了验证时序建模能力的标准环境，特别是在捕捉用户兴趣漂移和短期偏好预测方面展现出显著价值。

衍生相关工作

基于该数据集的特性，学术界衍生出多项创新研究。Transformer架构的时序推荐模型TISAN在2019年首次使用该数据集验证了自注意力机制在捕捉长程依赖上的优势；2021年华为诺亚方舟实验室提出的对比学习框架CL4SRec则利用该数据集证明了数据增强在序列推荐中的有效性。

数据集最近研究