five

RLAIF-V-Dataset 大规模多模态偏好数据集

收藏
超神经2024-06-07 更新2024-06-29 收录
下载链接:
https://hyper.ai/cn/datasets/32320
下载链接
链接失效反馈
官方服务:
资源简介:
RLAIF-V 数据集是一个由 AI 生成的多模态偏好数据集,它覆盖了各种任务和领域。该数据集包含超过 44,757 组高质量的对比对,用于训练和评估多模态大型语言模型 (MLLMs)。 RLAIF-V 数据集通过一个新颖的方法,采用开源大模型来对模型响应进行去混杂处理,并提供高质量的反馈数据,以减少不同 MLLMs 的幻觉现象。

The RLAIF-V dataset is an AI-generated multimodal preference dataset covering a diverse range of tasks and domains. It contains over 44,757 high-quality contrastive pairs for training and evaluating multimodal large language models (MLLMs). The RLAIF-V dataset adopts a novel method that uses open-source large language models to decontaminate model responses and provides high-quality feedback data, with the goal of reducing hallucinations across different MLLMs.
创建时间:
2024-06-06
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
RLAIF-V-Dataset是一个大规模多模态偏好数据集,包含44,757组高质量对比对,用于训练和评估多模态大型语言模型。该数据集以开源形式提供,涵盖多任务和多领域,采用CC BY NC 4.0许可证限制商业用途。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务