NUS-UAL/global-streetscapes|城市分析数据集|计算机视觉数据集
收藏Global Streetscapes 数据集概述
基本信息
- 许可证: CC BY-SA 4.0
- 任务类别:
- 图像分类
- 图像分割
- 图像特征提取
- 语言: 英语
- 标签:
- 街景图像
- 开放数据
- 数据融合
- 城市分析
- GeoAI
- 志愿者地理信息
- 机器学习
- 空间数据基础设施
- 数据规模: 1M < n < 10M
数据集内容
- 总大小: 约 62 GB
- 数据目录:
data/
(37 GB)- 包含 21 个 CSV 文件,总计 346 个特征,每文件 1000 万行,用于描述 1000 万张街景图像。
manual_labels/
(23 GB)train/
- 包含 8 个 CSV 文件,用于训练计算机视觉模型,分类 8 种不同的街景图像上下文特征,以及其他元数据(如图像位置、城市、文件路径等)。
test/
- 包含 8 个 CSV 文件,用于模型测试,以及其他元数据(如图像位置、城市、文件路径等)。
img/
- 包含 7 个
tar.gz
文件,包含所有用于训练和测试的图像。
- 包含 7 个
models/
(2.8 GB)- 包含 8 个
ckpt
文件,存储训练好的模型。
- 包含 8 个
- 其他文件:
cities688.csv
: 包含 688 个城市的基本信息,如人口、大陆、图像数量等。info.csv
: 概述/data
目录中每个 CSV 文件的内容,并解释 346 个特征。
引用
- 论文:
- Hou Y, Quintana M, Khomiakov M, Yap W, Ouyang J, Ito K, Wang Z, Zhao T, Biljecki F (2024): Global Streetscapes — A comprehensive dataset of 10 million street-level images across 688 cities for urban science and analytics. ISPRS Journal of Photogrammetry and Remote Sensing 215: 216-238. doi:10.1016/j.isprsjprs.2024.06.023
- BibTeX: bibtex @article{2024_global_streetscapes, author = {Hou, Yujun and Quintana, Matias and Khomiakov, Maxim and Yap, Winston and Ouyang, Jiani and Ito, Koichi and Wang, Zeyu and Zhao, Tianhong and Biljecki, Filip}, doi = {10.1016/j.isprsjprs.2024.06.023}, journal = {ISPRS Journal of Photogrammetry and Remote Sensing}, pages = {216-238}, title = {Global Streetscapes -- A comprehensive dataset of 10 million street-level images across 688 cities for urban science and analytics}, volume = {215}, year = {2024} }
UniProt
UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。
www.uniprot.org 收录
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
DLLG数据集
DLLG数据集是一个包含道路垃圾图片的数据集,主要用于训练深度学习模型以识别和分类道路垃圾。数据集来源包括机器人视角拍摄、手机相机拍摄和网络图片,涵盖塑料袋、饮料瓶和易拉罐三类垃圾。数据集旨在增强训练网络的鲁棒性,通过不同时间、天气和光照条件下的图片收集,以及包含不同形态的垃圾案例。
github 收录