vidpro-vc2-dataset
收藏VideoDPO 数据集概述
数据集名称
vidpro-vc2-dataset
数据集发布
- 发布日期:2024年12月27日
- 数据集链接:OneDrive
数据集背景
VideoDPO 是一个用于视频扩散生成的全偏好对齐数据集。该数据集旨在解决现有文本到视频生成模型在生成结果与用户偏好之间的偏差问题。通过引入 OmniScore,综合考虑视觉质量和文本与视频的语义对齐,VideoDPO 提供了一种自动收集偏好对数据的管道,并通过重新加权这些对来显著影响整体偏好对齐。
数据集内容
- 数据集包含用于训练和微调视频扩散模型的偏好对数据。
- 数据集结构可通过
configs/dpo/vidpro/train_data.yaml文件进行配置。
数据集使用
-
环境准备: shell conda create -n videodpo python=3.10 -y conda activate videodpo pip install -r requirements.txt
-
检查点准备:
-
VideoCrafter2: shell mkdir -p checkpoints/vc2 wget -P checkpoints/vc2 https://huggingface.co/VideoCrafter/VideoCrafter2/resolve/main/model.ckpt python utils/create_ref_model.py
-
T2V-Turbo(V1): shell mkdir -p checkpoints/t2v-turbo wget -O checkpoints/t2v-turbo/unet_lora.pt "https://huggingface.co/jiachenli-ucsb/T2V-Turbo-VC2/resolve/main/unet_lora.pt?download=true"
-
-
训练数据准备:
- 下载
vidpro-vc2-dataset.tar并链接到/data/vidpro-dpo-dataset。
- 下载
-
微调与推理:
-
VideoCrafter2: shell bash configs/vc_dpo/run.sh bash script_sh/inference_t2v.sh
-
T2V-Turbo(V1): shell bash configs/t2v_turbo_dpo/run.sh bash configs/t2v_turbo_dpo/turbo_visualize.sh
-
数据集结果
- OmniScore 分析:展示了 VideoCrafter2 视频的 OmniScore 差异、直方图、偏好对中的 OmniScore 差异以及跨维度的相关性热图。
- VideoDPO 对齐性能:在 VBench、HPS (V) 和 PickScore 上评估了 VideoDPO 的性能,展示了模型在视觉质量和语义对齐上的显著提升。
- 子维度得分比较:展示了 VC2、T2V-Turbo 和 CogVideo 在 VBench 上的子维度得分在对齐前后的变化。
- 消融研究:研究了不同策略和配置对模型性能的影响,包括对策略、过滤策略、α 值和 N 值的研究。
致谢
VideoDPO 的开发基于以下开源项目:




