five

video-ads-dataset|视频广告数据集|数据分析数据集

收藏
github2023-05-15 更新2024-05-31 收录
视频广告
数据分析
下载链接:
https://github.com/marianavsarantes/video-ads-dataset
下载链接
链接失效反馈
资源简介:
本数据集包含关于YouTube视频广告消费的研究数据,具体包括视频广告展示、广告API信息、观看API信息以及广告的每日观看次数时间序列数据。

This dataset comprises research data pertaining to YouTube video advertising expenditures, specifically including video ad impressions, advertising API information, viewing API information, and time-series data of daily ad views.
创建时间:
2017-03-31
原始信息汇总

数据集概述

本数据集包含以下文件,用于研究YouTube视频广告的消费行为:

1. video-ad-exhibitions.csv

  • 字段:
    • ad_id: 视频广告标识符
    • watch-id: 视频内容标识符
    • skip_dur: 用户跳过广告的时长(秒),若完整观看则为nan

2. ads-api.json

  • 字段:
    • title: 视频广告标题
    • description: 视频广告描述
    • categoryId: 视频广告类别
    • duration: 视频广告时长
    • viewCount: 视频广告总观看次数
    • publishedAt: 视频广告上传日期

3. watch-api.json

  • 字段:
    • title: 视频内容标题
    • description: 视频内容描述
    • categoryId: 视频内容类别
    • duration: 视频内容时长
    • viewCount: 视频内容总观看次数
    • channelId: 与视频内容关联的频道标识符

4. ads-timeseries.json

  • 内容: 视频广告每日观看次数的时间序列数据
AI搜集汇总
数据集介绍
main_image_url
构建方式
video-ads-dataset的构建基于对YouTube平台上视频广告消费行为的深入研究。数据集通过本地记录和YouTube API两种方式收集数据,涵盖了视频广告的展示情况、广告和视频内容的全局信息以及广告的每日观看次数时间序列。具体而言,video-ad-exhibitions.csv记录了用户观看视频广告的行为,ads-api.json和watch-api.json分别存储了广告和视频内容的元数据,ads-timeseries.json则提供了广告观看次数的每日变化情况。
特点
该数据集的特点在于其多维度的数据覆盖,不仅包括用户对视频广告的互动行为(如跳过广告的时间),还提供了广告和视频内容的详细元数据(如标题、描述、类别、时长等)。此外,ads-timeseries.json文件提供了广告观看次数的每日时间序列数据,为研究广告的长期表现和趋势分析提供了重要依据。数据集的结构化设计使得研究者能够从多个角度深入分析视频广告的消费行为。
使用方法
使用video-ads-dataset时,研究者可以通过video-ad-exhibitions.csv分析用户对广告的互动行为,如跳过广告的时间分布。ads-api.json和watch-api.json可用于研究广告和视频内容的属性及其对用户行为的影响。ads-timeseries.json则可用于时间序列分析,探索广告观看次数的变化趋势。通过结合这些文件,研究者能够全面理解视频广告的消费模式及其影响因素。
背景与挑战
背景概述
video-ads-dataset数据集由研究人员在探索YouTube视频广告消费行为的研究中创建,旨在深入理解用户与视频广告之间的互动模式。该数据集的核心研究问题聚焦于用户观看广告的行为特征,包括广告跳过时间、广告观看时长等关键指标。通过结合YouTube API获取的全局信息,如广告标题、描述、类别、时长等,研究人员能够全面分析广告内容与用户行为之间的关系。这一数据集为广告效果评估、用户行为预测等领域提供了重要的数据支持,推动了视频广告消费研究的深入发展。
当前挑战
video-ads-dataset数据集在解决视频广告消费行为分析问题时,面临多方面的挑战。首先,用户跳过广告的行为具有高度不确定性,如何准确捕捉并量化这一行为是研究的难点之一。其次,广告内容与用户兴趣的匹配度对广告效果有显著影响,但如何从海量数据中提取有效的特征并进行建模仍是一个复杂问题。此外,数据集的构建过程中,研究人员需处理来自YouTube API的异构数据,包括广告信息、视频内容信息以及时间序列数据,如何高效整合这些数据并确保其一致性与完整性,是构建过程中的主要技术挑战。
常用场景
经典使用场景
video-ads-dataset数据集在研究YouTube视频广告消费行为中扮演了关键角色。通过分析用户观看广告的时长、跳过广告的时间点以及广告的全局信息,研究者能够深入探讨用户对视频广告的接受度和互动模式。这一数据集为广告效果评估和用户行为预测提供了丰富的数据支持。
解决学术问题
该数据集解决了广告效果评估中的关键问题,如用户跳过广告的行为模式、广告观看时长与用户兴趣的相关性等。通过对广告展示次数、观看时长等数据的分析,研究者能够量化广告的吸引力,进而优化广告投放策略,提升广告的转化率和用户满意度。
衍生相关工作
基于video-ads-dataset,许多相关研究得以展开。例如,研究者开发了预测用户跳过广告行为的模型,以及基于广告观看时长的推荐系统。这些工作不仅深化了对视频广告消费行为的理解,还为广告投放的精准化和个性化提供了理论支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

data

食神オリジナルデータ

github 收录

Materials Project

材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)

OpenDataLab 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

用于陆面模拟的中国土壤数据集(第二版)

本研究对中国范围内0-2米六个标准深度层(0-5、5-15、15-30、30-60、60-100和100-200厘米)的23种土壤物理和化学属性进行了90米空间分辨率的制图。该数据集源自第二次土壤普查的8979个土壤剖面,世界土壤信息服务的1540个土壤剖面,第一次全国土壤普查的76个土壤剖面,以及区域数据库的614个土壤剖面。该数据集包括pH值、砂粒、粉粒、粘粒、容重、有机碳含量、砾石、碱解氮、总氮、阳离子交换量、孔隙度、总钾、总磷、有效钾、有效磷和土壤颜色(包括蒙赛尔颜色和RGB两种形式)。数据集的缺失值为“fillvalue = -32768”。数据集以栅格格式提供,有Tiff和netCDF两种格式。为了满足陆面建模中不同应用对空间分辨率的不同要求,CSDLv2 提供了 90 米、1 公里和 10公里空间分辨率的版本。各个土壤属性的单位参见说明文档。该数据集相对于第一版具有更好的数据质量,可广泛应用于陆面过程模拟等地学相关研究。

国家青藏高原科学数据中心 收录