VLLM-KnowledgeBoundary

Name: VLLM-KnowledgeBoundary
Creator: 上海科技大学信息科学与技术学院，阿里巴巴集团智能计算研究院
Published: 2025-02-25 17:32:08
License: 暂无描述

arXiv2025-02-25 更新2025-02-27 收录

下载链接：

http://arxiv.org/abs/2502.18023v1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是通过在多个现有数据集上采样视觉大型语言模型的响应自动构建的，用于确定模型的知识边界。数据集包含了各种类型的视觉问题回答查询，旨在解决视觉大型语言模型在回答知识密集型问题时存在的局限性。

This dataset is automatically constructed by sampling responses from visual large language models across multiple existing datasets, with the purpose of determining the knowledge boundaries of such models. It includes various types of visual question answering (VQA) queries, and is designed to address the limitations encountered by visual large language models when responding to knowledge-intensive questions.

提供机构：

上海科技大学信息科学与技术学院，阿里巴巴集团智能计算研究院

创建时间：

2025-02-25

搜集汇总

数据集介绍

构建方式

VLLM-KnowledgeBoundary 数据集构建方式描述

特点

VLLM-KnowledgeBoundary 数据集特点描述

使用方法

VLLM-KnowledgeBoundary 数据集使用方法描述

背景与挑战

背景概述

视觉大语言模型（VLLMs）在视觉问答（VQA）任务中取得了显著进展，但仍受限于知识范围。针对这一问题，陈卓等研究者于2025年提出了VLLM-KnowledgeBoundary数据集，旨在检测VLLMs的知识边界。该数据集通过在自动构建的数据集上微调VLLM，实现了对知识边界的识别，从而更有效地利用检索增强生成（RAG）等技术。该研究对于VLLMs在处理知识密集型问题、实时新闻和动态答案查询等方面的应用具有重要意义。

当前挑战

VLLM-KnowledgeBoundary数据集面临的主要挑战包括：1)如何准确识别VLLMs的知识边界，以减少对检索的依赖并提高模型性能；2)构建过程中如何构建具有多样性和代表性的训练数据集，以模拟真实世界的VQA查询；3)如何确保知识边界模型在不同VLLMs之间的泛化能力，以降低检索需求并保持或提高性能。

常用场景

经典使用场景

VLLM-KnowledgeBoundary数据集主要被用于检测视觉大型语言模型（VLLM）的知识边界。通过对VLLM进行微调，该数据集能够帮助模型更高效地使用检索增强生成（RAG）等技术，从而减少对检索的依赖并提高模型性能。

衍生相关工作

VLLM-KnowledgeBoundary数据集衍生了多种相关的工作。例如，一些研究使用该数据集来开发更智能的VLLM，使其能够更好地理解和处理图像和文本信息。此外，一些研究还使用该数据集来研究VLLM的知识边界，以及如何通过微调来提高模型的性能。

数据集最近研究