LLMPopcorn
收藏arXiv2025-02-18 更新2025-02-27 收录
下载链接:
http://arxiv.org/abs/2502.12945v1
下载链接
链接失效反馈官方服务:
资源简介:
LLMPopcorn数据集是由英国格拉斯哥大学、中国山东大学和西班牙电信科学研究机构创建的,包含根据用户提示生成的视频标题和视频生成提示。数据集分为具体和抽象两种用户提示类型,涵盖了动漫、美食、日常生活分享、电影与电视、游戏五大类别,每个类别各有二十个提示。该数据集用于评估大型语言模型在生成流行微视频方面的性能。
The LLMPopcorn dataset was developed by the University of Glasgow in the United Kingdom, Shandong University in China, and the Telefónica Scientific Research Institute. It comprises video titles and video generation prompts generated from user prompts. The dataset is categorized into two types of user prompts: concrete and abstract, and covers five core categories, namely animation, food, daily life sharing, film and television, and gaming, with 20 prompts allocated to each category. This dataset is employed to evaluate the performance of large language models (LLMs) in generating popular micro-videos.
提供机构:
英国格拉斯哥大学,中国山东大学,西班牙电信科学研究
创建时间:
2025-02-18
搜集汇总
数据集介绍

构建方式
LLMPopcorn数据集通过构建一个综合的流行短视频创作流程来利用大型语言模型(LLM)生成提示,以适应流行视频制作。该流程包括构建用户提示、利用LLM生成视频标题和视频生成提示、使用预训练的视频生成模型创建视频、以及使用预训练的视频流行度预测模型评估生成的视频。此外,该数据集还探索了基于检索增强生成(RAG)和思维链(CoT)提示的提示增强方法,以优化LLM生成的内容并提高其流行度。
特点
LLMPopcorn数据集的主要特点是它提供了一个全面的流行短视频创作流程,该流程利用LLM生成提示,并使用预训练的视频生成模型和视频流行度预测模型来评估生成的视频。此外,该数据集还探索了基于RAG和CoT提示的提示增强方法,以优化LLM生成的内容并提高其流行度。最后,该数据集还通过比较不同的LLM和视频生成模型,展示了DeepSeek-V3和DeepSeek-R1在LLM中的优越性能,以及LTXVideo和HunyuanVideo在视频生成中的领先地位。
使用方法
LLMPopcorn数据集的使用方法包括构建用户提示、利用LLM生成视频标题和视频生成提示、使用预训练的视频生成模型创建视频、以及使用预训练的视频流行度预测模型评估生成的视频。此外,还可以使用基于RAG和CoT提示的提示增强方法来优化LLM生成的内容并提高其流行度。最后,可以比较不同的LLM和视频生成模型,以评估它们在流行短视频生成任务中的性能。
背景与挑战
背景概述
随着短视频在TikTok和YouTube等平台上的兴起,它们已成为数字经济的核心要素,为社交媒体平台和内容创作者带来了巨大的商业价值。尽管大型语言模型(LLMs)如ChatGPT和DeepSeek在文本生成和推理方面具有先进的能力,但它们在辅助流行短视频创作方面的潜力尚未得到充分探索。LLMPopcorn数据集由英国格拉斯哥大学、中国山东大学和西班牙电信科学研究中心的研究人员于2025年创建,旨在研究LLMs在流行短视频创作中的应用。该数据集的核心研究问题是:如何有效地利用LLMs辅助流行短视频创作?基于提示的增强可以多大程度上优化LLM生成的内容以获得更高的流行度?各种LLMs和视频生成器在流行短视频创作任务中的表现如何?LLMPopcorn数据集的创建为AI辅助短视频创作提供了新的研究机会,并推动了相关领域的发展。
当前挑战
LLMPopcorn数据集面临的挑战包括:1) 如何有效地利用LLMs辅助流行短视频创作;2) 基于提示的增强可以多大程度上优化LLM生成的内容以获得更高的流行度;3) 各种LLMs和视频生成器在流行短视频创作任务中的表现如何。此外,LLMPopcorn数据集还面临着如何更好地衡量生成的视频的流行度、如何解决当前视频生成模型难以准确解释复杂提示的问题,以及如何通过微调LLM或视频生成模型来进一步改进视频质量和参与度等挑战。
常用场景
经典使用场景
LLMPopcorn数据集在流行微视频生成领域的应用主要体现在利用大型语言模型(LLM)辅助生成高质量的微视频内容。通过对用户输入的提示进行分析,LLMPopcorn能够生成视频标题和视频生成提示,并使用预训练的视频生成模型生成相应的视频。此外,LLMPopcorn还通过离线视频流行度预测模型评估生成的视频的潜在影响,从而帮助内容创作者更好地理解用户需求,提高视频内容的吸引力。LLMPopcorn的经典使用场景包括:
实际应用
LLMPopcorn数据集在实际应用场景中的应用主要体现在帮助内容创作者简化微视频的创作过程,提高视频内容的吸引力和流行度。具体而言,LLMPopcorn可以帮助内容创作者根据用户需求生成具有高流行度的视频标题和视频内容,从而提高视频在社交媒体平台上的曝光率和用户参与度。此外,LLMPopcorn还可以帮助内容创作者了解不同类型的视频在不同平台上的表现,从而更好地制定内容创作策略。LLMPopcorn的实际应用场景包括:
衍生相关工作
LLMPopcorn数据集的研究成果衍生了多个相关经典工作,为流行微视频生成领域的研究提供了重要的参考。具体而言,LLMPopcorn的研究结果表明,LLM在流行微视频生成领域具有巨大的潜力,可以有效地辅助内容创作者生成具有高流行度的视频内容。此外,LLMPopcorn的研究成果还表明,基于提示的增强可以进一步优化LLM生成的内容,从而提高视频内容的吸引力和流行度。LLMPopcorn的研究成果为AI辅助微视频创作领域的研究提供了新的思路和方法,并为进一步提高视频内容的吸引力和流行度提供了重要的参考。LLMPopcorn的衍生相关工作包括:
以上内容由遇见数据集搜集并总结生成



