LiFT-HRA-20K
收藏LiFT-HRA-20K 数据集概述
基本信息
- 许可证: MIT
- 任务类别:
- 视频-文本-文本
- 问答
- 语言: 英语
- 数据集规模: 10K < n < 100K
数据集简介
LiFT-HRA-20K 是一个高质量的人类偏好注释数据集,旨在用于训练视频-文本-文本奖励模型。该数据集中的所有视频分辨率至少为 512×512。
数据结构
数据集的目录结构如下:
DATA_PATH └─ LiFT-HRA-data.json └─ videos └─ HRA_part0.zip └─ HRA_part1.zip └─ HRA_part2.zip
使用方法
安装
-
克隆 GitHub 仓库并导航到 LiFT 文件夹: bash git clone https://github.com/CodeGoat24/LiFT.git cd LiFT
-
安装所需包: bash bash ./environment_setup.sh lift
训练
-
数据集: 下载 LiFT-HRA 数据集并将其放置在
./dataset目录下,数据结构如下:dataset ├── LiFT-HRA │ ├── LiFT-HRA-data.json │ ├── videos
-
训练脚本:
-
LiFT-Critic-13b: bash bash LiFT_Critic/train/train_critic_13b.sh
-
LiFT-Critic-40b: bash bash LiFT_Critic/train/train_critic_40b.sh
-
预训练模型权重
提供了在 LiFT-HRA 数据集上预训练的模型权重 LiFT-Critic。
引用
如果使用该数据集,请引用相关论文: bibtex @article{LiFT, title={LiFT: Leveraging Human Feedback for Text-to-Video Model Alignment.}, author={Wang, Yibin and Tan, Zhiyu, and Wang, Junyan and Yang, Xiaomeng and Jin, Cheng and Li, Hao}, journal={arXiv preprint arXiv:2412.04814}, year={2024} }




