tiktok-trending-hashtags
收藏Hugging Face2025-11-29 更新2025-11-30 收录
下载链接:
https://huggingface.co/datasets/ronantakizawa/tiktok-trending-hashtags
下载链接
链接失效反馈官方服务:
资源简介:
TikTok趋势话题标签数据集(2022-2025)是一个全面的流行话题标签数据集,涵盖了从2022年到2025年在多个年份、语言和文化背景下TikTok上的1830个独特话题标签。数据集捕捉了TikTok创意中心的流行话题标签,提供了关于病毒性内容、文化时刻和全球事件的深入了解。
The TikTok Trend Hashtag Dataset (2022–2025) is a comprehensive popular hashtag dataset that includes 1,830 unique TikTok hashtags spanning the period from 2022 to 2025 across diverse years, languages and cultural contexts. The dataset captures trending hashtags sourced from the TikTok Creative Center, offering in-depth insights into viral content, cultural moments and global events.
创建时间:
2025-11-29
原始信息汇总
TikTok Trending Hashtags (2022-2025) 数据集概述
📋 数据集基本信息
- 许可证: MIT
- 任务类别: 文本分类、时间序列预测
- 语言: 英语、西班牙语、阿拉伯语、泰语、越南语、葡萄牙语、中文、俄语、韩语、多语言
- 标签: TikTok、热门话题、标签、社交媒体、文化趋势
- 规模: 1K<n<10K
📊 数据集结构
数据格式
csv tag,year,rank,posts
列说明
tag(字符串): 不带#符号的标签名称year(整数): 标签流行年份 (2022-2025)rank(整数): 基于帖子数量的年度排名 (1=最高)posts(整数): 使用该标签的帖子总数
📈 数据集统计
- 总条目数: 1,830个标签
- 覆盖年份: 2022-2025
- 语言数量: 10+
- 类别: 体育、娱乐、新闻、游戏、文化活动、政治、节日
年度分布
- 2025年: 586个标签 (最新数据)
- 2024年: 909个标签 (最全面)
- 2023年: 329个标签
- 2022年: 6个标签 (早期数据有限)
🔍 关键洞察
年度热门标签
| 年份 | 排名第一标签 | 帖子数 | 主题 |
|---|---|---|---|
| 2025 | 2024 | 3,000,000 | 年度回顾 |
| 2024 | christmas | 3,000,000 | 节日季 |
| 2023 | 2024 | 2,000,000 | 新年期待 |
| 2022 | newyear | 286,000 | 新年庆祝 |
跨年度趋势标签
- happynewyear: 出现在5个不同场景中
- mondaymotivation: 在5个实例中持续每周趋势
- benfica: 在5个时期流行的运动队
- newyear: 覆盖4年
- valentinesday: 年度浪漫节日
- superbowl: 年度体育赛事
年度亮点
2024年:
- 选举: trump (267K)、election2024 (136K)、kamalaharris (97K)
- 体育: copaamerica (362K)、olympics (25K)、messi (489K)
- 娱乐: squidgame (1M)、deadpool (32K)、billieeilish (199K)
- 节日: christmas (3M)、valentinesday (1M)、diademuertos (956K)
2023年:
- 迪士尼百年: disney100 (829K)
- 游戏: fnaf (788K)
- 文化: recuerdame (776K)
2022年:
- 足球传奇: pele (117.7K)
- 病毒趋势: facechange (69.2K)
热门类别分布
- 节日与庆祝 (30%+): 圣诞节、新年、情人节、万圣节
- 体育与户外 (20%+): 足球、NFL、奥运会、篮球
- 娱乐与新闻 (25%+): 电影、电视节目、名人新闻
- 游戏 (10%): Squid Game、FNAF、Fortnite、Mobile Legends
- 文化活动 (10%): Dia de Muertos、Ramadan、农历新年
- 政治与社会 (5%): 选举、抗议、社会运动
帖子数量分布
- 百万+帖子: 8个标签 (超级病毒内容)
- 50万-100万帖子: 15个标签 (高度病毒性)
- 10万-50万帖子: 250+个标签 (流行趋势)
- 10万以下: 大多数 (小众或新兴趋势)
搜集汇总
数据集介绍

构建方式
在社交媒体分析领域,TikTok热门话题标签数据集通过系统化采集TikTok创意中心官方平台2022至2025年间的流行标签构建而成。数据采集过程严格遵循平台公开指标,以年度为单位记录每个标签的文本内容、排名次序及关联帖子数量,最终形成包含1,830条多语言条目的结构化集合。该构建方法确保了数据来源的权威性与时序连续性,为研究全球文化传播规律提供了坚实基础。
特点
该数据集最显著的特征体现在其跨文化维度与动态演进特性上。覆盖英语、西班牙语、阿拉伯语等十余种语言的标签内容,生动反映了不同地域的文化偏好与社交习惯。从数据分布观察,既有如圣诞节标签持续三年蝉联年度榜首的稳定文化现象,也包含政治选举、体育赛事等突发性热点事件,这种稳态与动态交织的格局为研究数字时代文化传播机制提供了丰富样本。
使用方法
研究人员可借助该数据集开展多维度分析,既可通过年度排名变化追踪特定文化符号的传播轨迹,也能基于帖子数量分布建立流行度预测模型。在具体应用层面,建议将标签按主题类别进行分组,结合其出现频次与持续时间构建文化影响力指数。对于跨语言比较研究,应注意区分原生文化标签与跨文化传播标签,以便更精确地揭示全球化背景下的文化交融规律。
背景与挑战
背景概述
社交媒体的兴起催生了数字文化趋势分析的新兴研究领域,TikTok Trending Hashtags数据集由TikTok创意中心于2022年至2025年间构建,旨在捕捉全球多语言环境下的病毒性内容传播规律。该数据集涵盖1830个独特标签,涉及体育、娱乐、政治等多元主题,通过量化标签的年度排名与发布量,为文化传播学与计算社会科学提供了关键的时空动态观测窗口。其跨年度的持续性记录不仅揭示了节日庆典与重大事件的内容生命周期,更成为研究数字集体记忆形成机制的重要实证基础。
当前挑战
在社交媒体趋势预测领域,该数据集需解决多语言文化语境下语义消歧的复杂性,例如相同标签在不同地区承载的差异化社会意义。数据构建过程中面临时空覆盖不均衡的挑战,早期2022年仅收录6个标签,而部分新兴文化现象因算法曝光机制可能未被充分捕捉。此外,海量帖子计数背后隐藏着机器人账户与重复内容对趋势真实性的干扰,要求研究者开发更精细的噪声过滤模型。跨年度可比性亦受平台算法更新与用户行为变迁的影响,需建立动态基准校正体系。
常用场景
经典使用场景
在社交媒体分析领域,TikTok流行话题标签数据集为研究者揭示了跨文化传播的独特视角。该数据集通过记录2022至2025年间1830个热门标签的排名与使用频次,成为研究数字时代文化符号演变的重要载体。学者们可借助多语言标签的时序变化,追踪全球性事件如奥运会、选举季在短视频平台上的传播轨迹,同时捕捉到像#mondaymotivation这类周期性内容的持久生命力。
衍生相关工作
基于该数据集衍生的经典研究已形成多维度成果。在计算社会科学领域,学者构建了文化符号传播的预测模型,通过#valentinesday等年度标签验证社交情绪的周期性规律。数字人文研究则通过#diademuertos等文化标签的跨区域传播,绘制出全球化时代的文化认同图谱。近期更有研究将游戏标签#fnaf与青少年亚文化形成机制相联结,拓展了虚拟社群研究的新路径。
数据集最近研究
最新研究方向
在社交媒体分析领域,TikTok流行话题标签数据集正推动跨文化传播模式的前沿探索。研究者聚焦多语言环境下话题标签的时空演化规律,通过分析2022至2025年间1830个标签的传播轨迹,揭示全球性事件与地域文化的共振机制。当前热点集中于算法推荐与用户行为的交互影响,特别是体育赛事、政治选举等重大事件在短视频平台的符号化呈现。该数据集为理解数字时代文化记忆的形成提供了关键实证基础,其多维度时间序列特征正助力构建更精准的流行趋势预测模型。
以上内容由遇见数据集搜集并总结生成



