Dyn-VQA Dataset
收藏Dyn-VQA Dataset
数据集概述
- 名称: Dyn-VQA Dataset
- 类型: 多模态问答数据集
- 描述: 包含三种类型的动态问题,旨在反映现实世界问题对动态知识检索的需求。
数据格式
数据集的JSON项组织格式如下: json { "image_url": "https://www.pcarmarket.com/static/media/uploads/galleries/photos/uploads/galleries/22387-pasewark-1986-porsche-944/.thumbnails/IMG_7102.JPG.jpg/IMG_7102.JPG-tiny-2048x0-0.5x0.jpg", "question": "What is the model of car from this brand?", "question_id": qid, "answer": ["保时捷 944", "Porsche 944."] }
更新信息
- 更新频率: 定期更新
- 最新版本: 202410
依赖环境
- Python = 3.11.9
- PyTorch (>= 2.0.0)
- pillow = 10.4.0
- requests = 2.32.3
- google-search-results = 2.4.2
- serpapi = 0.1.5
运行说明
- 代码发布: 已发布基于GPT-4V的OmniSearch代码,支持英文问题。
- 配置要求: 运行前需替换为个人OpenAI和Google搜索API密钥。
- 运行命令: bash python main.py --test_dataset path/to/dataset.jsonl --dataset_name NAME --meta_save_path path/to/results
评估方法
- 评估脚本: 提供用于评估输出答案的token F1-Recall的脚本。
- 使用方法: bash python evaluate.py --evaluate_file_path [path to output jsonl file] --lang [language of the QA dateset: en/zh]
未来计划
- 发布基于Qwen-VL-Chat的OmniSearch代码
- 发布相应的模型权重
引用信息
bigquery @article{li2024benchmarkingmultimodalretrievalaugmented, title={Benchmarking Multimodal Retrieval Augmented Generation with Dynamic VQA Dataset and Self-adaptive Planning Agent}, author={Yangning Li and Yinghui Li and Xinyu Wang and Yong Jiang and Zhen Zhang and Xinran Zheng and Hui Wang and Hai-Tao Zheng and Pengjun Xie and Philip S. Yu and Fei Huang and Jingren Zhou}, year={2024}, eprint={2411.02937}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2411.02937}, }




