YouTube Shorts & TikTok Trends 2025 Dataset
收藏github2025-09-13 更新2025-09-15 收录
下载链接:
https://github.com/tarekmasryo/YouTube-Shorts-TikTok-Trends-2025-Dataset
下载链接
链接失效反馈资源简介:
一个全面的、可用于分析的数据集,捕捉2025年YouTube Shorts和TikTok的趋势。覆盖100多个国家,2个平台(YouTube、TikTok),包含原始趋势数据、月度汇总、国家汇总、热门标签、热门创作者和元数据字典。包含参与率、标准化模式、去重ID、一致的平台和国家信息。
A comprehensive, analysis-ready dataset that captures trends from YouTube Shorts and TikTok in 2025. Covering over 100 countries and two platforms (YouTube and TikTok), it includes raw trend data, monthly summaries, country-level aggregates, trending hashtags, top creators, and a metadata dictionary. It also features engagement rates, standardized patterns, deduplicated IDs, as well as consistent platform and country information.
创建时间:
2025-09-13
原始信息汇总
YouTube Shorts & TikTok Trends 2025 数据集概述
数据集简介
一个全面、可用于分析的数据集,捕捉2025年(至今)的YouTube Shorts和TikTok趋势。
数据集内容
主要文件
- youtube_shorts_tiktok_trends_2025.csv:原始趋势级别数据(48,079行×58列)
- monthly_trends_2025.csv:月度活动汇总(480行×8列)
- country_platform_summary_2025.csv:国家×平台聚合统计(60行×14列)
- top_hashtags_2025.csv:平台热门标签(82行×18列)
- top_creators_impact_2025.csv:创作者影响力指标(1,000行×20列)
- DATA_DICTIONARY.csv:完整元数据(58行)
覆盖范围
- 时间跨度:2025年1月至8月
- 平台:YouTube Shorts、TikTok
- 国家:100+个独特市场(标准化名称)
- 记录数:约50,000条原始趋势行
数据特征
- 参与率指标
- 标准化模式
- 去重ID
- 一致的平台和国家信息
许可信息
- 许可证:CC0(公共领域)
- 使用权限:免费用于开放研究和教育
适用场景
- 数据科学
- 仪表板开发
- 市场研究
- 机器学习应用
AI搜集汇总
数据集介绍

构建方式
在短视频内容迅猛发展的背景下,该数据集通过系统采集2025年1月至8月期间YouTube Shorts与TikTok两大平台的海量趋势数据,覆盖全球超100个国家及地区。数据构建过程采用多源整合与标准化处理策略,包含原始趋势记录、月度聚合统计、国家-平台维度汇总、热门话题标签及创作者影响力等多个结构化文件。通过清洗去重、统一平台与国家命名、计算标准化互动指标等步骤,确保数据的一致性与分析可用性,最终形成包含约4.8万条原始记录的综合数据集。
使用方法
使用者可通过该数据集开展多样化的研究与应用,例如利用pandas等工具加载CSV文件进行探索性分析或建模。典型应用包括计算视频互动指标分布、按月统计内容产量与观看增长、比较不同国家或平台间的用户参与度差异、识别头部创作者及其影响力模式,以及分析热门话题的传播轨迹。该数据集兼容常见数据科学与机器学习流程,适用于构建可视化看板、进行市场洞察或训练推荐算法,为短视频生态研究提供坚实数据基础。
背景与挑战
背景概述
随着短视频内容成为数字媒体领域增长最快的内容形式,YouTube Shorts & TikTok Trends 2025 Dataset应运而生,由数据科学研究团队于2025年构建,旨在捕捉全球范围内短视频平台的趋势演变。该数据集覆盖100多个国家及两大主流平台,通过多维度指标如参与率、标准化架构和创作者影响力,为跨平台内容动态分析提供坚实基础,显著推动了社交媒体分析、计算广告学及数字人文领域的研究进展。
当前挑战
该数据集致力于解决短视频内容跨平台趋势分析与参与度建模的核心问题,面临多平台数据异构性、时空尺度下趋势演化捕捉,以及虚假流量干扰等挑战。构建过程中需克服数据采集的一致性难题,包括平台接口限制、跨国数据合规性约束,以及多模态元数据(如音轨及标签)的清洗与标准化,从而确保数据质量与可复现性。
常用场景
经典使用场景
在短视频内容生态研究领域,该数据集为跨平台趋势分析提供了标准化框架。研究者通过整合YouTube Shorts和TikTok双平台的实时数据流,能够精准追踪全球范围内热门话题的传播路径与演化规律,尤其适用于对比不同地域文化背景下用户参与度的差异化表现。
解决学术问题
该数据集有效解决了新媒体传播学中关于跨平台内容扩散机制的量化研究难题。通过提供去重化的创作者ID、标准化互动指标及多维度元数据,支持学者构建精准的传播动力学模型,进而揭示短视频内容病毒式传播的内在规律与跨文化适应特性。
实际应用
商业智能领域借助该数据集实现精准营销策略优化。品牌方可通过分析Top创作者影响力矩阵和标签热度时序变化,动态调整全球市场推广方案;平台运营团队则依据国家层级参与度基准指标,针对性优化内容推荐算法与区域化运营策略。
数据集最近研究
最新研究方向
随着短视频内容生态的持续扩张,YouTube Shorts与TikTok双平台数据集正成为数字传播学研究的前沿焦点。当前研究多聚焦于跨平台内容传播动力学,通过分析全球100余国家地区的标准化数据,揭示文化差异对热门标签与创作者影响力的调节作用。人工智能驱动的情感分析与趋势预测模型成为热点,结合多模态特征(如音频元数据与互动指标)构建 engagement 速率预测框架。该数据集亦被广泛应用于虚假信息传播路径追踪、区域化营销策略优化以及沉浸式内容生成算法的训练,为平台生态治理与商业智能决策提供关键实证基础。
以上内容由AI搜集并总结生成



