five

moranyanuka/OpenCHAIR

收藏
Hugging Face2024-03-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/moranyanuka/OpenCHAIR
下载链接
链接失效反馈
官方服务:
资源简介:
OpenCHAIR数据集是一个用于评估视觉语言模型(VLMs)在生成描述时产生幻觉问题的数据集。该数据集包含图像和文本特征,主要用于研究如何减少开放词汇描述中的幻觉现象。数据集由测试集组成,包含2000个样本,总大小为309448153字节。该数据集在论文《MOCHa: Multi-Objective Reinforcement Mitigating Caption Hallucinations》中首次引入,并提供了相关的GitHub代码库用于评估。

The OpenCHAIR dataset is a benchmark for evaluating hallucination issues in caption generation for Vision-Language Models (VLMs). It includes image and text features, and is primarily used to study methods for reducing hallucinations in open-vocabulary captioning. The dataset consists of a test split with 2000 samples, and has a total size of 309,448,153 bytes. This dataset was first introduced in the paper *MOCHa: Multi-Objective Reinforcement Mitigating Caption Hallucinations*, and a corresponding GitHub repository for evaluation is provided.
提供机构:
moranyanuka
原始信息汇总

OpenCHAIR 数据集概述

数据集名称

  • OpenCHAIR

数据集介绍

  • 该数据集是在“MOCHa: Multi-Objective Reinforcement Mitigating Caption Hallucinations”中正式引入的。
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
OpenCHAIR是一个多模态数据集,包含图像和文本数据,主要用于研究开放词汇描述中的幻觉问题。数据集提供了4,863条测试数据,格式为parquet,大小在1K到10K之间,且附带了相关的arXiv论文和GitHub仓库链接。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作