grail-interactions

Hugging Face2025-08-22 更新2025-08-23 收录

下载链接：

https://huggingface.co/datasets/od2961/grail-interactions

下载链接

链接失效反馈

官方服务：

资源简介：

grail-interactions数据集是一个基于用户交互行为构建的数据集，包含了视频ID、视频标题、用户观看视频的行为详情、选项板信息以及用户的配置文件描述等字段。数据集已经按照70/30的比例划分为训练集和验证集，适用于机器学习模型的训练和验证。

The Grail-Interactions Dataset is a user interaction behavior-based dataset that includes fields such as video ID, video title, detailed records of users' video viewing behaviors, palette information, and user profile descriptions. It has been split into training and validation sets at a 70/30 ratio, making it suitable for training and validating machine learning models.

创建时间：

2025-08-20

原始信息汇总

grail-interactions 数据集概述

数据集基本信息

名称：grail-interactions
标签：grail, recommendation, slate, bandit, human-preference
许可证：other
语言：英语 (en)
任务类别：推荐 (recommendation)
任务ID：slate-recommendation
规模：10K<n<100K

数据划分

训练集：41,239 条样本
验证集：4,578 条样本
划分比例：70/30 训练/验证

数据内容

每行包含的字段

Profile one-liner：用户人口统计信息的可读描述
Current item：当前视频的标题和ID
History up to current：观看历史记录（包含观看秒数和总时长）
Options：当前步骤展示的推荐选项列表（优先显示名称，ID作为备用）

关键列（由构建器生成）

current_video_id, current_video_title
watched_vids_json, watched_detailed_json
slate_items_json, slate_ids_json, slate_titles_json, slate_text, n_options
viewer_profile_sentence
state_text（包含PROFILE + CURRENTLY WATCHING + HISTORY + OPTIONS）

示例列（前30个）

worker_id, response_id, assignment_id, hit_id, qid, ytid, q87, q89, q5_2, q5_5, q5_11, q5_12, q58_1, q58_2, q58_3, q58_4, q89_1, q90, q6, q6_46_text, q56, q77, q8, q78, q9, q10, q12_1, q12_2, q12_3, q13

搜集汇总

数据集介绍

构建方式

在推荐系统领域，grail-interactions数据集通过平台交互记录构建，采用70/30比例划分训练集与验证集。数据采集过程涵盖用户观看历史、当前项目及推荐选项等多维度信息，每条记录包含用户画像描述、视频元数据及交互时序数据，并通过结构化JSON格式保存原始交互轨迹。

特点

该数据集显著特点在于融合了用户画像的自然语言描述与多模态交互特征，包含观看时长、视频总长度等细粒度时序信息。其slate推荐结构提供多选项对比数据，且通过标准化字段如slate_titles_json和state_text实现人机可读的双重数据表征，适用于隐式反馈与偏好联合建模。

使用方法

研究者可借助current_video_id与watched_vids_json构建用户状态表征，利用slate_items_json训练推荐策略模型。验证集适用于评估slate推荐效果，state_text字段可直接输入语言模型进行序列决策学习，而viewer_profile_sentence支持个性化推荐算法的跨用户泛化能力验证。

背景与挑战

背景概述

grail-interactions数据集由推荐系统研究领域的前沿团队构建，专注于交互式推荐场景下的用户行为建模。该数据集通过记录用户在视频推荐平台上的实时交互行为，包括当前观看内容、历史观看序列及推荐选项面板，为推荐算法研究提供了丰富的上下文信息。其核心研究问题在于如何通过面板推荐（slate recommendation）和bandit学习机制，精准捕捉用户偏好并优化推荐策略，对个性化推荐系统的演进具有重要推动作用。

当前挑战

该数据集致力于解决面板推荐场景中动态用户偏好建模的挑战，包括多选项联合概率估计、用户隐式反馈的噪声处理以及实时决策中的探索-利用权衡。在构建过程中，面临数据稀疏性与用户行为序列的长程依赖性问题，同时需确保交互日志的隐私合规性。面板选项的异构特征表示与用户历史行为的动态编码进一步增加了数据构建的复杂度。

常用场景

经典使用场景

在推荐系统研究中，grail-interactions数据集为slate推荐任务提供了丰富的交互记录。该数据集通过捕获用户在视频平台上的实时行为序列，包括当前观看内容、历史交互记录和推荐选项列表，为多臂赌博机算法和上下文感知推荐模型提供了理想的训练环境。研究者可利用其70/30的规范划分比例，有效验证推荐策略在模拟用户偏好时的性能表现。

衍生相关工作

基于该数据集衍生的经典工作主要集中在神经排序模型和上下文多臂赌博机算法的创新上。研究者开发了融合用户画像和序列历史的深度推荐架构，提出了基于注意力机制的slate生成策略。这些工作显著推进了交互式推荐系统的理论框架，并催生了新一代能够处理复杂用户反馈的混合推荐模型，为领域设立了新的性能基准。

数据集最近研究