five

CityLens

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/tsinghua-fib-lab/CityLens
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个全面性的基准测试,旨在评估大型语言视觉模型通过分析全球17个不同城市卫星和街景图像来预测社会经济指标的能力。该数据集包含11项预测任务,并使用R²和nRMSE等指标进行评估。其规模覆盖了6个关键领域:经济、教育、犯罪、交通、健康和环境,任务目标是利用视觉数据预测社会经济指标。

This dataset is a comprehensive benchmark designed to evaluate the capability of Large Vision-Language Models (LVLMs) in predicting socioeconomic indicators by analyzing satellite and street-view images from 17 distinct cities across the globe. It includes 11 prediction tasks, with model performance evaluated using metrics such as R² and normalized Root Mean Squared Error (nRMSE). The dataset spans six core domains: economy, education, crime, transportation, health, and environment, with the overarching objective of leveraging visual data to forecast socioeconomic indicators.
提供机构:
Tsinghua University FIB Lab
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作