five

NUS-UAL/global-streetscapes|城市分析数据集|计算机视觉数据集

收藏
hugging_face2024-07-19 更新2024-07-22 收录
城市分析
计算机视觉
下载链接:
https://hf-mirror.com/datasets/NUS-UAL/global-streetscapes
下载链接
链接失效反馈
资源简介:
Global Streetscapes数据集是一个包含1000万张街景图像的综合性数据集,覆盖了全球688个城市。该数据集由新加坡国立大学城市分析实验室(UAL)创建,旨在为城市科学和分析提供支持。数据集分为表格部分和图像部分,表格部分包括21个CSV文件,每个文件包含1000万行数据,描述了346个特征。此外,数据集还包含手动标注的训练和测试数据,用于训练计算机视觉模型,以及训练好的模型文件。数据集的总大小为62 GB,图像部分约为6 TB。

The Global Streetscapes dataset, created by the Urban Analytics Lab (UAL) at the National University of Singapore, contains 10 million street-level images across 688 cities. The dataset is divided into several parts: the `data/` directory contains 21 CSV files, each with 10 million rows and a total of 346 features; the `manual_labels/` directory contains manual labels for training and testing computer vision models; the `models/` directory contains trained models; `cities688.csv` contains basic information for the 688 cities; `info.csv` provides an overview of each CSV files content and explains the 346 features. The total size of the dataset is approximately 62GB, with the imagery portion being about 6TB.
提供机构:
NUS-UAL
原始信息汇总

Global Streetscapes 数据集概述

基本信息

  • 许可证: CC BY-SA 4.0
  • 任务类别:
    • 图像分类
    • 图像分割
    • 图像特征提取
  • 语言: 英语
  • 标签:
    • 街景图像
    • 开放数据
    • 数据融合
    • 城市分析
    • GeoAI
    • 志愿者地理信息
    • 机器学习
    • 空间数据基础设施
  • 数据规模: 1M < n < 10M

数据集内容

  • 总大小: 约 62 GB
  • 数据目录:
    • data/ (37 GB)
      • 包含 21 个 CSV 文件,总计 346 个特征,每文件 1000 万行,用于描述 1000 万张街景图像。
    • manual_labels/ (23 GB)
      • train/
        • 包含 8 个 CSV 文件,用于训练计算机视觉模型,分类 8 种不同的街景图像上下文特征,以及其他元数据(如图像位置、城市、文件路径等)。
      • test/
        • 包含 8 个 CSV 文件,用于模型测试,以及其他元数据(如图像位置、城市、文件路径等)。
      • img/
        • 包含 7 个 tar.gz 文件,包含所有用于训练和测试的图像。
    • models/ (2.8 GB)
      • 包含 8 个 ckpt 文件,存储训练好的模型。
  • 其他文件:
    • cities688.csv: 包含 688 个城市的基本信息,如人口、大陆、图像数量等。
    • info.csv: 概述 /data 目录中每个 CSV 文件的内容,并解释 346 个特征。

引用

  • 论文:
    • Hou Y, Quintana M, Khomiakov M, Yap W, Ouyang J, Ito K, Wang Z, Zhao T, Biljecki F (2024): Global Streetscapes — A comprehensive dataset of 10 million street-level images across 688 cities for urban science and analytics. ISPRS Journal of Photogrammetry and Remote Sensing 215: 216-238. doi:10.1016/j.isprsjprs.2024.06.023
  • BibTeX: bibtex @article{2024_global_streetscapes, author = {Hou, Yujun and Quintana, Matias and Khomiakov, Maxim and Yap, Winston and Ouyang, Jiani and Ito, Koichi and Wang, Zeyu and Zhao, Tianhong and Biljecki, Filip}, doi = {10.1016/j.isprsjprs.2024.06.023}, journal = {ISPRS Journal of Photogrammetry and Remote Sensing}, pages = {216-238}, title = {Global Streetscapes -- A comprehensive dataset of 10 million street-level images across 688 cities for urban science and analytics}, volume = {215}, year = {2024} }
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

UniProt

UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。

www.uniprot.org 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

DLLG数据集

DLLG数据集是一个包含道路垃圾图片的数据集,主要用于训练深度学习模型以识别和分类道路垃圾。数据集来源包括机器人视角拍摄、手机相机拍摄和网络图片,涵盖塑料袋、饮料瓶和易拉罐三类垃圾。数据集旨在增强训练网络的鲁棒性,通过不同时间、天气和光照条件下的图片收集,以及包含不同形态的垃圾案例。

github 收录