SnapUGC
收藏arXiv2025-09-03 更新2025-09-05 收录
下载链接:
https://github.com/dasongli1/SnapUGC_Engagement/tree/main/ECR_inference
下载链接
链接失效反馈官方服务:
资源简介:
SnapUGC数据集是一个大规模的短视频数据集,包含来自Snapchat Spotlight平台的120,651个短视频,每个视频都附带来自观看统计的参与度数据。该数据集旨在通过实际用户互动产生的参与度指标,如标准化平均观看百分比(NAWP)和参与度延续率(ECR),来预测用户的参与度。与传统的视频质量评估方法相比,SnapUGC更注重视频的实际观看情况,从而为研究用户参与度提供了新的视角和工具。
The SnapUGC dataset is a large-scale short video dataset comprising 120,651 short videos sourced from the Snapchat Spotlight platform, with each video paired with engagement data derived from viewing statistics. This dataset aims to predict user engagement using engagement metrics generated from actual user interactions, such as Normalized Average Watch Percentage (NAWP) and Engagement Continuity Rate (ECR). Compared with traditional video quality assessment methods, SnapUGC places greater emphasis on the actual viewing behavior of videos, thus providing novel perspectives and research tools for studies on user engagement.
提供机构:
Snapchat
创建时间:
2025-09-03
搜集汇总
数据集介绍

构建方式
SnapUGC数据集构建过程聚焦于社交媒体平台用户生成内容的真实互动数据,从Snapchat Spotlight公开渠道系统采集了120,651条时长介于5至60秒的短视频。为确保数据可靠性,仅筛选观看次数超过2000次的视频,涵盖家庭、美食、宠物、旅行及音乐等多个内容类别。每条视频均附带创作者提供的标题与描述文本,其互动指标基于大规模真实用户行为计算,有效规避了传统小规模人工标注带来的偏差。
特点
该数据集的核心特征体现在其多模态结构与创新性评估指标。除视频视觉内容外,同步整合音频轨道与创作者提供的文本元数据,形成视觉-听觉-文本三重模态融合。其评估体系引入标准化平均观看百分比(NAWP)与互动持续率(ECR)两项指标,前者通过线性归一化处理解决不同时长视频的跨维度比较问题,后者以观看超5秒的概率量化视频初始吸引力。ECR与NAWP的相关系数高达0.928,显著提升了 engagement 预测的鲁棒性。
使用方法
数据集划分为106,192条训练样本、6000条验证样本与8459条测试样本,支持端到端的 engagement 预测任务。使用方法涵盖多模态特征提取与融合策略:视觉分支可采用预训练模型(如CLIP、EfficientNetV2)提取帧级特征,音频分支通过BEATs等模型处理声学信息,文本分支利用BERT类模型编码标题与描述语义。预测目标可聚焦ECR值回归,通过Transformer等架构实现跨模态表征学习,最终输出0-1区间的 engagement 概率评分。
背景与挑战
背景概述
SnapUGC数据集由Snap Inc.联合多所高校研究团队于2025年创建,旨在解决社交媒体平台中用户生成短视频的参与度预测问题。该数据集包含12万余条来自Snapchat Spotlight平台的短视频,每条视频均附带从真实用户交互中提取的参与度指标,如标准化平均观看比例和参与延续率。通过融合视觉、音频和文本多模态特征,SnapUGC为冷启动推荐和内容质量评估提供了重要数据基础,显著推动了短视频生态系统的算法优化与用户体验研究。
当前挑战
该数据集核心挑战在于解决短视频冷启动推荐中的参与度预测偏差问题,传统方法因初始用户样本量有限导致预测噪声较大。构建过程中需克服多模态数据对齐的复杂性,包括视觉内容、音频特征与创作者提供元数据的融合技术难题,同时需确保从海量真实交互数据中提取的参与度指标具备跨视频时长的可比性,并严格保护用户隐私以避免个人信息泄露。
常用场景
经典使用场景
在短视频用户生成内容分析领域,SnapUGC数据集被广泛应用于多模态特征融合的参与度预测研究。该数据集通过整合视觉内容、音频特征及创作者提供的文本元数据,为模型训练提供了丰富的输入维度,典型应用包括基于深度学习的Engagement Continuation Rate(ECR)预测任务,例如在ICCV 2025研讨会挑战赛中,参赛团队利用其构建的跨模态框架实现了用户观看行为的高精度建模。
解决学术问题
SnapUGC数据集有效解决了传统视频质量评估(VQA)方法在短视频流行度预测中的局限性问题。通过引入基于真实用户交互的标准化平均观看百分比(NAWP)和参与持续率(ECR)指标,该数据集克服了主观评分与小规模标注带来的偏差,为冷启动推荐、多模态特征关联性分析以及用户行为建模提供了可靠基准,推动了社交媒体内容分发机制的学术研究进展。
衍生相关工作
基于SnapUGC数据集衍生的经典工作包括多模态大模型(如Video-LLaMA和Qwen2.5-VL)在参与度预测中的适配研究,以及ECNU-SJTU VQA团队提出的特征融合框架。这些工作进一步推动了Engagement Continuation Rate的预测精度,并激发了文本特征(如XGBoost模型)与非视觉模态联合建模的新方向,为短视频分析领域提供了可扩展的技术路径。
以上内容由遇见数据集搜集并总结生成



