five

scb10x/avhallubench

收藏
Hugging Face2024-10-14 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/scb10x/avhallubench
下载链接
链接失效反馈
官方服务:
资源简介:
AVHalluBench数据集用于评估音频-视觉大语言模型(LLMs)中的幻觉水平。该数据集包含175个视频,每个视频都配有无幻觉的音频和视觉描述。每个实例包括视频ID、数据来源、音频描述和视觉描述。数据集的视频可以通过提供的链接下载,模型生成的输出可以与提供的音频和视觉描述进行比较。

AVHalluBench数据集用于评估音频-视觉大语言模型(LLMs)中的幻觉水平。该数据集包含175个视频,每个视频都配有无幻觉的音频和视觉描述。每个实例包括视频ID、数据来源、音频描述和视觉描述。数据集的视频可以通过提供的链接下载,模型生成的输出可以与提供的音频和视觉描述进行比较。
提供机构:
scb10x
原始信息汇总

数据集概述

数据集名称

AVHalluBench

数据集用途

用于评估音频-视觉大型语言模型(LLMs)中的幻觉水平。

数据集内容

包含175个视频,每个视频配有无幻觉的音频和视觉描述。

数据集统计

详细统计信息可参考提供的图表,更多信息见相关论文。

数据集结构

  • video_id: 视频的唯一标识
  • source: 视频数据来源
  • audio_description: 无幻觉的手动音频描述
  • visual_description: 无幻觉的手动视频描述

数据集访问

视频可在以下链接下载:AVHalluBench视频数据集

引用信息

@misc{sun2024crosscheckgpt, title={CrossCheckGPT: Universal Hallucination Ranking for Multimodal Foundation Models}, author={Guangzhi Sun and Potsawee Manakul and Adian Liusie and Kunat Pipatanakul and Chao Zhang and Phil Woodland and Mark Gales}, year={2024}, eprint={2405.13684}, archivePrefix={arXiv}, primaryClass={cs.CL} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作