stochastic/random_streetview_images_pano_v0.0.2
收藏数据集概述
数据集描述
数据集摘要
随机街景图像数据集是从randomstreetview.com抓取的标记全景图像。每个图像显示一个可通过Google Streetview访问的位置,这些图像被大致组合以提供单个位置的约360度视图。该数据集旨在仅基于图像的视觉内容进行图像地理定位。
支持的任务和排行榜
目前没有支持的任务和排行榜。
语言
- 标签:地址以英语和所属国家的官方语言的组合书写。
- 图像:有些图像带有标识,可能包含某种语言,但较为罕见。
数据集结构
数据实例
每个实例包含:
- 时间戳文件名:
{YYYYMMDD}_{address}.jpg - 图像
- 国家ISO-alpha2代码
- 纬度
- 经度
- 地址
数据字段
country_iso_alpha2:遵循ISO 3166标准的每个国家的唯一2字符代码latitude:地点相对于地球赤道的角距离(北或南)longitude:地点相对于地球标准子午线的角距离(东或西)address:从最微观到宏观顺序书写的物理地址(街道、社区、城市、州、国家)
数据分割
所有图像目前都包含在train分割中。
数据集创建
策划理由
Google StreetView图像按抓取的每张图像收费。 该数据集免费提供了大约10,000张这样的图像。
源数据
源图像生产者
Google Street View提供原始图像,该数据集将各种切割的图像组合成全景图。
标注
标注过程
地址、纬度和经度都是从API响应中抓取的。虽然部分数据已手动验证,但准确性的保证基于API响应的正确性。
个人和敏感信息
虽然Google Street View尽最大努力模糊图像和车牌,但不能保证,如某些照片所示。请查看Google的文档了解更多信息。
使用数据的考虑
数据集的社会影响
该数据集是在玩流行的在线游戏geoguessr.com的启发下设计的。我们要求该数据集的用户考虑他们的基于地理定位的应用程序是否会伤害或危及任何公平的机构或系统。
偏见的讨论
在现有的约195个国家中,该数据集仅包含来自约55个国家的图像。每个国家平均有175张照片,有些国家略少。
这55个国家是: ["ZA","KR","AR","BW","GR","SK","HK","NL","PE","AU","KH","LT","NZ","RO","MY","SG","AE","FR","ES","IT","IE","LV","IL","JP","CH","AD","CA","RU","NO","SE","PL","TW","CO","BD","HU","CL","IS","BG","GB","US","SI","BT","FI","BE","EE","SZ","UA","CZ","BR","DK","ID","MX","DE","HR","PT","TH"]
按大陆划分:
| 大陆 | 代表的国家数量 |
|---|---|
| 欧洲 | 30 |
| 亚洲 | 13 |
| 南美洲 | 5 |
| 非洲 | 3 |
| 北美洲 | 3 |
| 大洋洲 | 2 |
这不是世界的公平代表,包括各种气候、社区和整体地点。但这是一个开始!
其他已知限制
根据Google的政策:"Street View图像仅显示我们的相机在经过该地点那天能够看到的内容。之后,处理它们需要几个月的时间。这意味着您看到的内容可能从几个月到几年不等。"
许可信息
MIT许可证
引用信息
贡献
感谢@WinsonTruong和@David Hrachovy帮助开发这个数据集。该数据集是为上述开发人员@samhita-alla和@yiyixuxu的Geolocator项目开发的。
感谢FSDL提供精彩的课程和在线班级。




