five

UrBench

收藏
arXiv2024-08-30 更新2024-09-03 收录
下载链接:
https://opendatalab.github.io/UrBench/
下载链接
链接失效反馈
官方服务:
资源简介:
UrBench是由上海人工智能实验室等机构创建的综合性城市环境评估数据集,包含11.6K条问题,覆盖地理定位、场景推理、场景理解和对象理解四个维度。数据集通过结合现有数据集和收集自11个城市的数据,利用跨视图检测匹配方法创建新的标注,并整合多种方法生成高质量问题。UrBench主要用于评估和提升大型多模态模型在城市环境中的应用能力,特别是在多视角理解方面的性能。

UrBench is a comprehensive urban environment evaluation dataset created by Shanghai AI Laboratory and other institutions. It comprises 11.6K questions covering four core dimensions: geolocation, scene reasoning, scene understanding, and object understanding. The dataset is developed by integrating existing datasets and data collected from 11 cities, adopting cross-view detection and matching approaches to generate new annotations, and combining multiple methods to produce high-quality questions. UrBench is primarily designed to evaluate and improve the application capabilities of large multimodal models in urban environments, particularly their performance in multi-view understanding.
提供机构:
上海人工智能实验室, 中山大学, 商汤科技研究, 武汉大学
创建时间:
2024-08-30
搜集汇总
数据集介绍
main_image_url
构建方式
UrBench数据集的构建过程融合了现有数据集的数据,并额外收集了来自11个城市的数据。通过引入一种跨视图检测匹配方法,创建了新的标注。随后,结合基于大型多模态模型(LMM)、规则和人工的方法,构建了大规模高质量的问题集。这一过程确保了数据集在多视图城市场景中的全面性和多样性。
特点
UrBench数据集的显著特点在于其多视图和多任务的特性。它包含了11.6K个精心设计的问题,涵盖了地理定位、场景推理、场景理解和对象理解四个维度,共计14种任务类型。此外,数据集还特别强调了城市环境中的多视图关系理解,提供了卫星视图、街道视图和跨视图的图像,以评估模型在复杂城市环境中的表现。
使用方法
UrBench数据集适用于评估和开发大型多模态模型(LMMs)在城市环境中的能力。研究者可以使用该数据集进行模型训练和测试,以评估模型在地理定位、场景推理、场景理解和对象理解等任务中的表现。通过分析模型在不同视图和任务类型中的表现,可以进一步优化和提升模型的性能,特别是在处理多视图城市数据时的能力。
背景与挑战
背景概述
近年来,大型多模态模型(LMMs)在多个领域展现出卓越的能力,但在城市环境中的评估仍显不足。为此,上海人工智能实验室、中山大学、商汤科技和武汉大学的研究人员共同创建了UrBench数据集。该数据集于2024年提出,旨在全面评估LMMs在多视角城市场景中的表现。UrBench包含11.6K精心设计的问题,涵盖地理定位、场景推理、场景理解和对象理解四个维度,共14种任务类型。通过整合现有数据集和从11个城市收集的新数据,UrBench采用跨视角检测匹配方法创建了高质量的标注。该数据集的发布对提升LMMs在复杂城市环境中的应用能力具有重要意义。
当前挑战
UrBench数据集在构建过程中面临多项挑战。首先,跨视角场景的标注创建是一个关键难题,尽管获取配对的街景和卫星图像相对容易,但创建关于其跨视角对应关系的问题仍然困难。其次,当前的LMMs在处理城市环境任务时表现不佳,尤其是在地理定位和对象属性识别等复杂任务上,与人类专家相比存在显著差距。此外,LMMs在不同城市视角下的表现不一致,特别是在理解跨视角关系方面存在明显不足。这些挑战揭示了现有LMMs在城市环境理解中的局限性,为未来的研究提供了改进方向。
常用场景
经典使用场景
UrBench 数据集在评估大型多模态模型(LMMs)在多视角城市场景中的能力方面具有经典应用。该数据集通过精心设计的11.6K个问题,涵盖了地理定位、场景推理、场景理解和对象理解四个维度,共计14种任务类型。这些任务不仅包括区域级别的评估,还扩展到角色级别的日常问题解决,从而全面评估模型在复杂城市环境中的表现。
实际应用
UrBench 数据集在实际应用中具有广泛潜力,特别是在城市规划和管理领域。例如,政府官员可以使用该数据集评估模型在城市发展规划中的辅助能力,而市民则可以利用这些模型在日常生活中做出更明智的决策。此外,该数据集还可用于开发能够从多个视角理解城市环境的智能助手,提升城市生活的智能化水平。
衍生相关工作
UrBench 数据集的发布催生了一系列相关研究工作,特别是在多模态模型在城市环境中的应用评估方面。例如,一些研究开始探索如何利用 UrBench 数据集改进模型的跨视角理解能力,以及如何将这些模型应用于更广泛的城市任务。此外,该数据集还激发了对多视角数据收集和标注方法的研究,进一步推动了多模态模型在复杂环境中的应用和发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作