five

Short video dataset of Douyin

收藏
Mendeley Data2023-11-11 更新2024-06-29 收录
下载链接:
https://www.doi.org/10.57760/sciencedb.j00133.00348
下载链接
链接失效反馈
官方服务:
资源简介:
The data set is crawled by the author through the selenium framework and third-party API. The video comes from the Tiktok platform, and the time span is from January 24, 2019 to May 14, 2022. It contains video information folders and result set folders respectively. The data information is mainly saved as csv and txt files. The video information folder includes the URL of the video, video publisher information, video information, video cover, and video audio, with the video title text being blurred. The video results folder contains the original image files, experimental results, and experimental analysis results in the manuscript, specifically including video similarity, video theme, video audio features, video sentiment, clustering SSE, audio sentiment model, etc. 

本数据集由作者通过Selenium框架(Selenium)与第三方API爬取获取,视频数据源自抖音(Tiktok)平台,时间跨度为2019年1月24日至2022年5月14日。数据集分别包含视频信息文件夹与结果集文件夹两类目录,数据信息主要以CSV与TXT文件格式存储。 视频信息文件夹涵盖视频链接、发布者信息、视频详情、视频封面及视频音频,其中视频标题文本已做模糊处理。 视频结果文件夹则包含原稿中的原始图像文件、实验结果及实验分析结果,具体涵盖视频相似度、视频主题、视频音频特征、视频情感、聚类SSE、音频情感模型等内容。
创建时间:
2023-11-11
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个来自抖音平台的短视频多模态数据集,包含2019年至2022年间的视频信息和多种分析结果,适用于网络舆情、情感分析等研究。数据集大小为2.13GB,主要文件格式为csv和txt。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作