RLAIF-V-Dataset 大规模多模态偏好数据集

超神经2024-06-07 更新2024-06-29 收录

下载链接：

https://hyper.ai/cn/datasets/32320

下载链接

链接失效反馈

官方服务：

资源简介：

RLAIF-V 数据集是一个由 AI 生成的多模态偏好数据集，它覆盖了各种任务和领域。该数据集包含超过 44,757 组高质量的对比对，用于训练和评估多模态大型语言模型 (MLLMs）。 RLAIF-V 数据集通过一个新颖的方法，采用开源大模型来对模型响应进行去混杂处理，并提供高质量的反馈数据，以减少不同 MLLMs 的幻觉现象。

The RLAIF-V dataset is an AI-generated multimodal preference dataset covering a diverse range of tasks and domains. It contains over 44,757 high-quality contrastive pairs for training and evaluating multimodal large language models (MLLMs). The RLAIF-V dataset adopts a novel method that uses open-source large language models to decontaminate model responses and provides high-quality feedback data, with the goal of reducing hallucinations across different MLLMs.

创建时间：

2024-06-06

搜集汇总

数据集介绍

背景与挑战

背景概述

RLAIF-V-Dataset是一个大规模多模态偏好数据集，包含44,757组高质量对比对，用于训练和评估多模态大型语言模型。该数据集以开源形式提供，涵盖多任务和多领域，采用CC BY NC 4.0许可证限制商业用途。

以上内容由遇见数据集搜集并总结生成