Video Contextual Taxonomy & Keywords
收藏数据集概述:Video Contextual Taxonomy & Keywords
1. 数据集简介
- 提供方: Qortex
- 核心功能: 为在线视频资产提供AI提取的上下文信号。每条视频被分析后,可生成最多20个带类型标签(如人物、组织、事件、团队、产品等)的关键词/实体,以及每个术语的语义别名(Aliases),支持超越精确关键词的广泛上下文匹配。
- 分类体系: 视频还会被映射到IAB内容分类法的页面级和视频级类别,附带来源域名和URL归属。
2. 应用场景
该数据集适用于以下场景:
- 无Cookie上下文定位: 大规模进行隐私合规的上下文定向。
- 程序化广告库存细分: 基于关键词进行库存分析和定位。
- 品牌对齐实体识别: 定位涉及特定运动员、团队或事件的视频。
- 广告类别排除: 基于内容分类法进行广告类别过滤。
- SEO与内容发现: 支持搜索优化和内容推荐等应用。
3. 业务需求
数据集支持以下业务需求:
- 受众细分: 通过提取的关键词、实体类型和IAB 2.2类别细分视频库存,构建无Cookie的上下文受众群体。
- 加速广告收入: 通过关键词级别和IAB类别定位,增加程序化广告收入。
- 受众激活: 利用带实体标签的视频和语义别名激活上下文定向广告活动。
- 市场分析: 通过关键词频率、实体提取及IAB类别分布分析内容趋势。
- 无Cookie定位: 支持AI提取的关键词、实体类型和别名,并与IAB 2.2分类体系映射。
- 内容分类: 基于文本分析,将视频内容归类到最多4级深度的IAB 2.2分类体系中。
4. 数据字典
数据集包含两个主要表:
| 表名 | 描述 | 关键列 |
|---|---|---|
| VIDEO_KEYWORDS | 视频级的关键词/实体及其别名 | LOGICAL_VIDEO_ID, KEYWORD, ENTITY_TYPE, ALIASES |
| VIDEO_IAB_CATEGORIES | 视频级的IAB 2.2内容分类(最多4个层级) | PAGE_URL, LOGICAL_VIDEO_ID, MEDIA_IAB22_TIER1_NAME, MEDIA_IAB22_TIER2_NAME, MEDIA_IAB22_TIER3_NAME, MEDIA_IAB22_TIER4_NAME |
5. 数据使用示例
-
查找涉及特定实体(例如NBA)的视频: sql SELECT LOGICAL_VIDEO_ID, KEYWORD, ENTITY_TYPE, ALIASES FROM CONTEXTUAL_TAXONOMY.VIDEO_KEYWORDS WHERE KEYWORD ILIKE %NBA% OR ARRAY_CONTAINS(NBA::VARIANT, ALIASES) LIMIT 100;
-
查看整个数据集中最热门的关键词: sql SELECT KEYWORD, ENTITY_TYPE, COUNT(DISTINCT LOGICAL_VIDEO_ID) AS VIDEO_COUNT FROM CONTEXTUAL_TAXONOMY.VIDEO_KEYWORDS GROUP BY KEYWORD, ENTITY_TYPE ORDER BY VIDEO_COUNT DESC LIMIT 50;
-
按IAB一级类别统计视频数量: sql SELECT MEDIA_IAB22_TIER1_NAME AS IAB_CATEGORY, COUNT(DISTINCT LOGICAL_VIDEO_ID) AS VIDEO_COUNT FROM CONTEXTUAL_TAXONOMY.VIDEO_IAB_CATEGORIES WHERE MEDIA_IAB22_TIER1_NAME IS NOT NULL GROUP BY 1 ORDER BY VIDEO_COUNT DESC LIMIT 30;
-
查找提及特定人物(例如Taylor Swift)的视频: sql SELECT LOGICAL_VIDEO_ID, KEYWORD, ALIASES FROM CONTEXTUAL_TAXONOMY.VIDEO_KEYWORDS WHERE ENTITY_TYPE = person AND KEYWORD ILIKE %Taylor Swift% LIMIT 100;
-
查找高关键词密度的视频: sql SELECT LOGICAL_VIDEO_ID, COUNT(*) AS KEYWORD_COUNT FROM CONTEXTUAL_TAXONOMY.VIDEO_KEYWORDS GROUP BY LOGICAL_VIDEO_ID HAVING KEYWORD_COUNT >= 15 ORDER BY KEYWORD_COUNT DESC LIMIT 100;
6. 试用与定价
- 试用: 提供包含50条样本视频的免费试用版,包含完整的关键词提取、实体类型、语义别名和IAB 2.2分类,无时间限制。
- 定价: 页面显示为“Contextual Targeting”,具体价格需联系获取(点击“GetUnlock New Insights”)。
7. 数据集特性
- 更新频率: 每日(Daily)更新。
- 交付方式: Secure share(安全共享)。
- 法律条款: 标准(Standard)。



