RLAIF-V-Dataset
收藏RLAIF-V-Dataset 数据集概述
基本信息
- 语言: 英语
- 许可证: CC BY-NC 4.0
- 任务类别: 视觉问答
- 数据集名称: RLAIF-V-Dataset
数据集结构
特征
- image: 图像数据
- question: 问题文本
- answer: 答案文本
数据分割
- train:
- 样本数量: 2493
- 数据大小: 377139114.334 字节
配置
- config_name: default
- 数据文件路径: data/train-*
数据集摘要
- 类型: 大规模多模态反馈数据集
- 反馈对数量: 83,132
- 数据来源: 包括 MSCOCO, ShareGPT-4V, MovieNet, Google Landmark v2, VQA v2, OKVQA, TextVQA 等
- 目标: 提升模型的可信度,使其优于开源和专有模型
数据字段
| 序号 | 字段名 | 描述 |
|---|---|---|
| 0 | ds_name |
数据集名称 |
| 1 | image |
包含路径和字节的字典,可自动转换为PIL图像 |
| 2 | question |
多模态语言模型的输入查询 |
| 3 | chosen |
问题的被选答案 |
| 4 | rejected |
问题的被拒绝答案 |
| 5 | origin_dataset |
图像或问题的原始数据集 |
| 6 | origin_split |
每个数据项的元信息,包括生成被选和被拒绝答案对的模型名称、提供反馈的标注模型以及问题类型(详细描述或问答) |
| 7 | idx |
数据索引 |
| 8 | image_path |
图像路径 |
引用
bibtex @article{yu2023rlhf, title={Rlhf-v: Towards trustworthy mllms via behavior alignment from fine-grained correctional human feedback}, author={Yu, Tianyu and Yao, Yuan and Zhang, Haoye and He, Taiwen and Han, Yifeng and Cui, Ganqu and Hu, Jinyi and Liu, Zhiyuan and Zheng, Hai-Tao and Sun, Maosong and others}, journal={arXiv preprint arXiv:2312.00849}, year={2023} }
@article{yu2024rlaifv, title={RLAIF-V: Aligning MLLMs through Open-Source AI Feedback for Super GPT-4V Trustworthiness}, author={Yu, Tianyu and Zhang, Haoye and Yao, Yuan and Dang, Yunkai and Chen, Da and Lu, Xiaoman and Cui, Ganqu and He, Taiwen and Liu, Zhiyuan and Chua, Tat-Seng and Sun, Maosong}, journal={arXiv preprint arXiv:2405.17220}, year={2024}, }




