scb10x/avhallubench

Name: scb10x/avhallubench
Creator: scb10x
Published: 2024-10-14 08:23:15
License: 暂无描述

Hugging Face2024-10-14 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/scb10x/avhallubench

下载链接

链接失效反馈

官方服务：

资源简介：

AVHalluBench数据集用于评估音频-视觉大语言模型（LLMs）中的幻觉水平。该数据集包含175个视频，每个视频都配有无幻觉的音频和视觉描述。每个实例包括视频ID、数据来源、音频描述和视觉描述。数据集的视频可以通过提供的链接下载，模型生成的输出可以与提供的音频和视觉描述进行比较。

提供机构：

scb10x

原始信息汇总

数据集概述

数据集名称

AVHalluBench

数据集用途

用于评估音频-视觉大型语言模型（LLMs）中的幻觉水平。

数据集内容

包含175个视频，每个视频配有无幻觉的音频和视觉描述。

数据集统计

详细统计信息可参考提供的图表，更多信息见相关论文。

数据集结构

video_id: 视频的唯一标识
source: 视频数据来源
audio_description: 无幻觉的手动音频描述
visual_description: 无幻觉的手动视频描述

数据集访问

视频可在以下链接下载：AVHalluBench视频数据集

引用信息

@misc{sun2024crosscheckgpt, title={CrossCheckGPT: Universal Hallucination Ranking for Multimodal Foundation Models}, author={Guangzhi Sun and Potsawee Manakul and Adian Liusie and Kunat Pipatanakul and Chao Zhang and Phil Woodland and Mark Gales}, year={2024}, eprint={2405.13684}, archivePrefix={arXiv}, primaryClass={cs.CL} }

5,000+

优质数据集

54 个

任务类型

进入经典数据集