five

Social Media Prediction Dataset (SMPD)

收藏
arXiv2025-09-30 收录
下载链接:
http://smp-challenge.com/dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个大型的社交多媒体研究基准,包含了来自69,000名用户的超过486,000条帖子。这些帖子包含了视觉、文本以及时空等多模态信息。此外,数据集中包含了756个按主题分类的关键词,跨越11个话题领域,以及668个人工精细划分的第三级类别,并且提供了从世界级别到街道级别的地理精度。这是一个大规模的数据集,大约有半个百万条帖子。该数据集的任务是预测社交媒体帖子的流行度。

This dataset is a large-scale social multimedia research benchmark containing over 486,000 posts from 69,000 users. These posts encompass multimodal information including visual, textual, and spatiotemporal data. Additionally, the dataset includes 756 topic-classified keywords spanning 11 topical domains, 668 manually curated third-level categories, and provides geographic granularity ranging from global to street-level. As a large-scale dataset, it totals approximately half a million posts. The core task of this benchmark is to predict the popularity of social media posts.
提供机构:
SMP Challenge
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Social Media Prediction Dataset (SMPD)包含SMPD-Image和SMPD-Video两个子数据集,分别涵盖48.6万张社交图片和6000个短视频,涉及大量用户和多样化标签。该数据集是一个多面性、大规模且具有时间性的网络数据集合,来源于Flickr和Tiktok等平台,适合用于社交媒体的预测和分析研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作