GSV-Cities|视觉地点识别数据集|城市图像数据数据集
收藏GSV-Cities 数据集概述
数据集内容
- 图像数量: 约530,000张
- 地点数量: 超过62,000个不同的地点
- 地点分布: 全球多个城市
- 图像覆盖: 每个地点至少有4张图像,最多可达20张
- 地点间距: 所有地点之间物理距离至少100米
数据集组织
-
图像命名规则:
city_placeID_year_month_bearing_latitude_longitude_panoid.JPG
-
数据集结构:
├── Images │ ├── City1 │ │ ├── ... │ ├── City2 │ │ ├── ... └── Dataframes ├── City1.csv ├── City2.csv ├── ...
-
数据帧内容: 包含每个城市的元数据,便于使用Pandas快速访问
数据集用途
- 性能提升: 可用于训练视觉地点识别模型,以达到新的最先进性能
- 快速训练: 训练模型速度极快,每个epoch预计10-15分钟
- 简化流程: 无需离线三元组挖掘,直接形成批次,简化预处理流程
- 快速原型: 无需等待多日模型收敛,适用于快速原型开发
训练模型评估
- 评估工具: 使用提供的Jupyter Notebook进行模型评估
- 评估指标: 包括R@1和R@5等,针对不同测试集如Pitts250k-test, Pitts30k-test, MSLS-val, Nordland等
- 预训练模型: 提供基于ResNet50的不同输出维度模型,详细性能指标见README中的表格
数据集访问
- 数据集托管: 托管于Kaggle平台,链接为Kaggle

RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录
China Groundgroundwater Monitoring Network
该数据集包含中国地下水监测网络的数据,涵盖了全国范围内的地下水位、水质和相关环境参数的监测信息。数据包括但不限于监测站点位置、监测时间、水位深度、水质指标(如pH值、溶解氧、总硬度等)以及环境因素(如气温、降水量等)。
www.ngac.org.cn 收录
猫狗图像数据集
该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。
github 收录
SWaT Dataset
SWaT Dataset是一个用于工业控制系统(ICS)安全研究的数据集,包含了模拟的网络攻击和正常操作的数据。该数据集由新加坡科技设计大学(Singapore University of Technology and Design)发布,旨在帮助研究人员开发和测试用于检测工业控制系统中网络攻击的算法和模型。
itrust.sutd.edu.sg 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录