five

stochastic/random_streetview_images_pano_v0.0.2

收藏
Hugging Face2022-10-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/stochastic/random_streetview_images_pano_v0.0.2
下载链接
链接失效反馈
官方服务:
资源简介:
随机街景图像数据集是从randomstreetview.com抓取的带有标签的全景图像。每张图像显示一个可以通过Google Street View访问的位置,这些图像被大致组合以提供单个位置的约360度视角。该数据集的设计目的是仅基于其视觉内容对图像进行地理定位。数据集包含约10,000张图像,涵盖了55个国家的约175张照片,主要集中在欧洲和亚洲。

The Random Street View Image Dataset consists of labeled panoramic images scraped from randomstreetview.com. Each image displays a location accessible via Google Street View, and these images are roughly combined to provide an approximate 360-degree view of a single location. This dataset is designed to geolocate images solely based on their visual content. It contains approximately 10,000 images covering roughly 175 locations across 55 countries, with a primary focus on Europe and Asia.
提供机构:
stochastic
原始信息汇总

数据集概述

数据集描述

数据集摘要

随机街景图像数据集是从randomstreetview.com抓取的标记全景图像。每个图像显示一个可通过Google Streetview访问的位置,这些图像被大致组合以提供单个位置的约360度视图。该数据集旨在仅基于图像的视觉内容进行图像地理定位。

支持的任务和排行榜

目前没有支持的任务和排行榜。

语言

  • 标签:地址以英语和所属国家的官方语言的组合书写。
  • 图像:有些图像带有标识,可能包含某种语言,但较为罕见。

数据集结构

数据实例

每个实例包含:

  • 时间戳文件名:{YYYYMMDD}_{address}.jpg
  • 图像
  • 国家ISO-alpha2代码
  • 纬度
  • 经度
  • 地址

数据字段

  • country_iso_alpha2:遵循ISO 3166标准的每个国家的唯一2字符代码
  • latitude:地点相对于地球赤道的角距离(北或南)
  • longitude:地点相对于地球标准子午线的角距离(东或西)
  • address:从最微观到宏观顺序书写的物理地址(街道、社区、城市、州、国家)

数据分割

所有图像目前都包含在train分割中。

数据集创建

策划理由

Google StreetView图像按抓取的每张图像收费。 该数据集免费提供了大约10,000张这样的图像。

源数据

源图像生产者

Google Street View提供原始图像,该数据集将各种切割的图像组合成全景图。

标注

标注过程

地址、纬度和经度都是从API响应中抓取的。虽然部分数据已手动验证,但准确性的保证基于API响应的正确性。

个人和敏感信息

虽然Google Street View尽最大努力模糊图像和车牌,但不能保证,如某些照片所示。请查看Google的文档了解更多信息。

使用数据的考虑

数据集的社会影响

该数据集是在玩流行的在线游戏geoguessr.com的启发下设计的。我们要求该数据集的用户考虑他们的基于地理定位的应用程序是否会伤害或危及任何公平的机构或系统。

偏见的讨论

在现有的约195个国家中,该数据集仅包含来自约55个国家的图像。每个国家平均有175张照片,有些国家略少。

这55个国家是: ["ZA","KR","AR","BW","GR","SK","HK","NL","PE","AU","KH","LT","NZ","RO","MY","SG","AE","FR","ES","IT","IE","LV","IL","JP","CH","AD","CA","RU","NO","SE","PL","TW","CO","BD","HU","CL","IS","BG","GB","US","SI","BT","FI","BE","EE","SZ","UA","CZ","BR","DK","ID","MX","DE","HR","PT","TH"]

按大陆划分:

大陆 代表的国家数量
欧洲 30
亚洲 13
南美洲 5
非洲 3
北美洲 3
大洋洲 2

这不是世界的公平代表,包括各种气候、社区和整体地点。但这是一个开始!

其他已知限制

根据Google的政策"Street View图像仅显示我们的相机在经过该地点那天能够看到的内容。之后,处理它们需要几个月的时间。这意味着您看到的内容可能从几个月到几年不等。"

许可信息

MIT许可证

引用信息

贡献

感谢@WinsonTruong@David Hrachovy帮助开发这个数据集。该数据集是为上述开发人员@samhita-alla@yiyixuxu的Geolocator项目开发的。

感谢FSDL提供精彩的课程和在线班级。

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建基于对Google Street View提供的原始图像进行整合,通过抓取API响应中的地址、纬度和经度信息,并手动验证部分数据,以创建具有地理定位标签的全景街景图像。数据集包含了大约10,000张图像,覆盖了世界上约55个国家,旨在为用户提供一个无需付费即可访问的街景图像资源。
使用方法
用户可以根据需要自行决定如何拆分训练集。数据集以MIT许可证提供,允许自由使用和共享。在使用数据集时,用户应当注意图像可能包含个人敏感信息,需遵循Google的使用政策,并在开发地理定位应用时考虑可能的社会影响和公平性问题。
背景与挑战
背景概述
随机街景图像数据集(stochastic/random_streetview_images_pano_v0.0.2)是由专家生成标注的360度全景街景图像集合,旨在基于图像视觉内容进行地理位置定位。该数据集约包含10,000张图像,来源于randomstreetview.com,并由Google Street View提供原始图像。数据集创建的初衷是为了解决街景图像的高成本获取问题,为研究者提供免费资源。自发布以来,该数据集在地理定位、图像识别等领域产生了积极影响,助力相关研究的进展。
当前挑战
数据集在构建和应用过程中面临多方面的挑战。首先,数据集的地理位置分布不均,仅涵盖约55个国家,对全球地理环境的代表性不足。其次,数据标注的准确性依赖于API响应的正确性,存在潜在的误差。此外,尽管Google Street View尽力模糊个人和敏感信息,但不能完全保证数据中不含有可识别信息,使用时需谨慎处理。在研究领域问题方面,如何提高图像分类和地理定位的准确性,以及如何处理图像数据的老化问题,是该数据集面临的主要技术挑战。
常用场景
经典使用场景
在地理信息系统(GIS)领域,stochastic/random_streetview_images_pano_v0.0.2数据集的360度全景街景图像被广泛应用于图像分类任务,其核心应用场景在于通过视觉内容对图像进行地理位置定位。该数据集使得研究人员能够训练模型,以识别和推断图像中的地理特征,从而实现自动化的地标识别和城市环境分析。
解决学术问题
该数据集解决了学术研究中对于大规模、多样化地理图像的需求问题。通过提供覆盖不同国家和地区的街景图像,它帮助学者们克服了地理信息标注的成本障碍,并促进了地理识别技术的进步。此外,它还提供了对于图像中个人和敏感信息的隐私保护讨论,引导研究人员在使用数据时进行伦理考量。
实际应用
在实际应用中,该数据集可用于开发智能导航系统、增强现实应用以及城市规划中的可视化工具。通过训练模型识别各种地标和城市结构,该数据集有助于提高地理信息系统的准确性和实用性,进而为公众提供更为精确的地理位置服务。
数据集最近研究
最新研究方向
stochastic/random_streetview_images_pano_v0.0.2数据集为研究者提供了丰富的随机街景全景图像,旨在基于图像视觉内容对图像进行地理定位。该数据集的最新研究方向聚焦于图像分类与地理信息标注,特别是多标签图像分类任务,以实现对图像中蕴含的地理位置信息的精准识别与提取。在此领域,研究者们正致力于通过深度学习模型来提高定位的准确性,并在图像中识别出更多细粒度的地理特征,如街道类型、建筑风格等,这对于推动地理信息系统(GIS)与计算机视觉的融合具有重要意义。此外,该数据集的运用还关联到了在线地理猜谜游戏geoguessr.com的热点事件,为游戏提供了丰富的数据支持,同时激发了公众对于地理信息学的兴趣。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作