five

Text-to-Film-Bench (T2F-Bench)

收藏
github2026-01-22 更新2026-01-24 收录
下载链接:
https://github.com/showlab/T2F-Bench
下载链接
链接失效反馈
官方服务:
资源简介:
Text-to-Film-Bench (T2F-Bench) 是一个全面的基准测试,专为叙事驱动、多镜头的AI视频生成而设计。该数据集包含100个高质量提示,源自标志性的电影场景,并通过Gemini转化为专业剧本。该基准测试评估AI模型作为“导演”的能力,将复杂剧本转化为连贯、具有电影感和情感共鸣的长视频。

Text-to-Film-Bench (T2F-Bench) is a comprehensive benchmark specifically designed for narrative-driven, multi-shot AI video generation. This dataset contains 100 high-quality prompts sourced from iconic film scenes, which are converted into professional screenplays via Gemini. This benchmark evaluates the ability of AI models to act as "directors" to convert complex screenplays into coherent, cinematic and emotionally resonant long-form videos.
创建时间:
2026-01-22
原始信息汇总

Text-to-Film-Bench (T2F-Bench) 数据集概述

数据集简介

Text-to-Film-Bench (T2F-Bench) 是一个专为叙事驱动、多镜头AI视频生成设计的综合性基准测试。该基准测试将焦点从简短的描述性片段转向叙事性,旨在评估AI模型作为“导演”将复杂剧本转化为连贯、具有电影感且能引起情感共鸣的长视频的能力。

数据集内容

数据集包含 100个高质量提示,这些提示源自标志性的电影场景,并由Gemini转化为专业的剧本。核心数据文件为 AI-Film-Eval-Prompt.csv,其中包含了用于模型输入的多镜头剧本提示。

评估框架

评估从一个制片人审核AI生成的电影(多镜头长视频) 的视角进行,包含五个维度的加权评估:

1. 叙事与故事一致性 [30%]

  • 核心问题:“AI导演”是否成功捕捉了剧本所需的“戏剧性”?
  • 评估子项
    • 情节完整性与完整性 [20%]
    • 情节逻辑性 [20%]
    • 元素准确性 [20%](角色、服装/道具、环境/时间)
    • 风格与基调 [20%]
    • 对话与口型同步 [20%](避免口技表演、幻影语音,确保同步)

2. 连续性与一致性 [25%]

  • 核心问题:模型的“记忆”如何?是否存在现实“断裂”?
  • 评估子项
    • 角色一致性 [40%](面部、发型、服装在镜头切换间保持一致)
    • 时空逻辑 [35%](地理锚定、时间流)
    • 视觉色调一致性 [25%]

3. 电影语言 [20%]

  • 核心问题:镜头构图和摄像机工作是否具有意图性?
  • 评估子项
    • 镜头设计 [50%](有效使用广角、中景和特写镜头,自然过渡)
    • 摄像机运动与互动 [30%](动机、质量)
    • 剪辑 [20%](流畅的剪辑点)

4. 视觉美学与技术质量 [10%]

  • 核心问题:画面是否美观(上限)且物理效果是否合理(下限)?
  • 评估子项
    • 电影美学 [60%](构图规则、灯光深度、高保真纹理)
    • 技术完整性 [40%](无伪影,如裁剪、物理谬误、渲染问题)

5. 表演与演技 [15%]

  • 核心问题:角色是“活生生的灵魂”还是“木偶”?
  • 评估子项
    • 面部表情与潜台词 [40%]
    • 语音表演 [30%]
    • 肢体表演 [30%]

评估原则

  1. 独立性:每个维度独立评估。高视觉质量不能弥补叙事一致性差的问题。
  2. 强制失败:严重故障(如“身体恐怖”扭曲、背景瞬移或口技表演)将导致该子类别自动获得最低分(1分)。
  3. 区分优先:在Elo比较中,应避免平局,除非两个片段确实无法区分。

使用流程

  1. 生成:使用 AI-Film-Eval-Prompt.csv 中的剧本作为模型的输入。
  2. 评估:遵循上述五维框架进行人工审核。
  3. 基准测试:将您的结果与提供的基线进行比较。

许可证

本项目依据MIT许可证分发。更多信息请参见 LICENSE 文件。

搜集汇总
数据集介绍
main_image_url
构建方式
在叙事驱动的多镜头AI视频生成领域,Text-to-Film-Bench(T2F-Bench)的构建体现了对电影艺术与人工智能融合的深度探索。该数据集的核心源于100个源自标志性电影场景的高质量提示,这些提示经由Gemini模型转化为专业剧本,从而确保了叙事内容的丰富性与戏剧张力。构建过程注重从短描述性片段向长叙事视频的范式转变,旨在模拟AI导演将复杂剧本转换为连贯、具有电影感且情感共鸣的多镜头长视频的能力。
使用方法
使用该数据集时,研究者首先需以提供的多镜头剧本提示作为输入,驱动AI视频生成模型产出相应影片。随后,依据五维评估框架进行人工参与审计,逐项评估叙事完整性、角色一致性、镜头设计、视觉美学及表演真实感等指标。最终,将评测结果与基准线比较,实现模型能力的量化对比与性能提升,从而推动叙事驱动视频生成技术的迭代与发展。
背景与挑战
背景概述
随着人工智能在视频生成领域的快速发展,现有基准多集中于短片段描述性内容的评估,缺乏对叙事连贯性与电影艺术表达的深度考量。Text-to-Film-Bench(T2F-Bench)由研究团队于近期构建,旨在填补这一空白,专注于叙事驱动的多镜头AI视频生成。该数据集包含100个源自经典电影场景的高质量提示,并经由Gemini模型转化为专业剧本,核心研究问题在于评估AI模型能否如导演般将复杂剧本转换为情感共鸣、结构完整的长篇视频。这一基准的建立推动了生成式视频技术向更高层次的艺术创作与逻辑一致性迈进,为相关领域提供了关键的评估框架。
当前挑战
在视频生成领域,长叙事视频的创建面临多重挑战:一是叙事与故事对齐的复杂性,要求模型准确把握情节完整性、逻辑因果及元素准确性,避免关键行动缺失或风格脱节;二是连续性与一致性的维持,涉及角色外观、时空逻辑与视觉色调的稳定,防止跨镜头断裂;三是电影语言的有意运用,包括镜头设计、摄像机运动与剪辑的合理性;四是视觉美学与技术质量的平衡,需在追求艺术效果的同时规避物理谬误与渲染瑕疵;五是表演与动作的自然性,要求角色情感表达与生物力学运动贴合现实。数据构建过程中,挑战体现在将电影场景转化为可评估的剧本提示,并设计多维度的量化框架,以涵盖从叙事到技术的综合评估标准。
常用场景
经典使用场景
在人工智能视频生成领域,Text-to-Film-Bench(T2F-Bench)作为一个专注于叙事驱动、多镜头长视频生成的基准测试,其经典使用场景在于评估AI模型如何将复杂的电影剧本转化为连贯且富有情感共鸣的视觉叙事。该数据集通过100个源自标志性电影场景的高质量提示,转化为专业剧本,要求模型扮演“导演”角色,生成具有完整叙事弧、角色一致性和电影语言的长视频,从而推动模型在故事讲述能力上的突破。
解决学术问题
T2F-Bench解决了当前AI视频生成研究中普遍存在的短片段、描述性生成局限,将焦点转向长视频叙事连贯性与逻辑性。它通过多维度评估框架,如叙事对齐、连续性、电影语言等,系统性地量化模型在生成复杂故事时的表现,为研究社区提供了衡量模型“导演”能力的标准,促进了生成视频在逻辑、情感和艺术性方面的学术探索,填补了叙事驱动视频评估的空白。
实际应用
在实际应用中,T2F-Bench可服务于电影制作、广告创意和虚拟内容生成等行业,帮助开发者和创作者测试AI视频生成工具在长视频叙事中的可行性。例如,在预制作阶段,利用该基准评估模型生成的视频片段是否符合剧本要求,优化生成流程;在教育或娱乐领域,它支持自动生成具有完整故事线的教学视频或短片,提升内容生产的效率与质量,推动AI技术在创意产业中的落地。
数据集最近研究
最新研究方向
在人工智能视频生成领域,叙事驱动的长视频创作正成为前沿焦点。Text-to-Film-Bench(T2F-Bench)作为首个专注于多镜头电影化生成的基准测试,突破了传统短片段描述的局限,将评估体系提升至导演级叙事维度。该数据集通过100个源自经典电影场景的专业剧本,引导模型模拟“AI导演”角色,强调情节连贯性、角色一致性、电影语言运用等综合能力。其多维评估框架涵盖了叙事对齐、视觉连续性、镜头设计等关键指标,直接回应了当前生成式视频在长序列中易出现的逻辑断裂、风格漂移等挑战。这一基准的建立,不仅推动了视频生成技术向更高阶的创作层次演进,也为跨模态叙事人工智能的研究提供了标准化评估路径,在影视工业化与AI内容生成融合的背景下具有显著的实践意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作