scb10x/avhallubench
收藏Hugging Face2024-10-14 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/scb10x/avhallubench
下载链接
链接失效反馈官方服务:
资源简介:
AVHalluBench数据集用于评估音频-视觉大语言模型(LLMs)中的幻觉水平。该数据集包含175个视频,每个视频都配有无幻觉的音频和视觉描述。每个实例包括视频ID、数据来源、音频描述和视觉描述。数据集的视频可以通过提供的链接下载,模型生成的输出可以与提供的音频和视觉描述进行比较。
AVHalluBench数据集用于评估音频-视觉大语言模型(LLMs)中的幻觉水平。该数据集包含175个视频,每个视频都配有无幻觉的音频和视觉描述。每个实例包括视频ID、数据来源、音频描述和视觉描述。数据集的视频可以通过提供的链接下载,模型生成的输出可以与提供的音频和视觉描述进行比较。
提供机构:
scb10x
原始信息汇总
数据集概述
数据集名称
AVHalluBench
数据集用途
用于评估音频-视觉大型语言模型(LLMs)中的幻觉水平。
数据集内容
包含175个视频,每个视频配有无幻觉的音频和视觉描述。
数据集统计
详细统计信息可参考提供的图表,更多信息见相关论文。
数据集结构
video_id: 视频的唯一标识source: 视频数据来源audio_description: 无幻觉的手动音频描述visual_description: 无幻觉的手动视频描述
数据集访问
视频可在以下链接下载:AVHalluBench视频数据集
引用信息
@misc{sun2024crosscheckgpt, title={CrossCheckGPT: Universal Hallucination Ranking for Multimodal Foundation Models}, author={Guangzhi Sun and Potsawee Manakul and Adian Liusie and Kunat Pipatanakul and Chao Zhang and Phil Woodland and Mark Gales}, year={2024}, eprint={2405.13684}, archivePrefix={arXiv}, primaryClass={cs.CL} }



