TJNU-Ground-based-Cloud-Dataset|气象学数据集|图像分类数据集
收藏TJNU-Ground-based-Cloud-Dataset
数据集概述
- 时间范围:2019年至2020年
- 采集地点:中国九个省份,包括天津、安徽、四川、甘肃、山东、河北、辽宁、江苏和海南
- 数据量:包含19,000张地面云图
- 图像格式:JPEG格式,分辨率为512×512像素
- 分类:根据国际云分类系统标准和视觉相似性,将天空条件分为七种类型:
- 积云
- 高积云和卷积云
- 卷云和卷层云
- 晴空
- 层积云、层云和高层云
- 积雨云和雨层云
- 混合云
- 云量分类:云量不超过10%的图像被归类为晴空
- 数据划分:10,000张训练图像和9,000张测试图像
- 标注:由气象学家和地面云研究者共同标注
使用条款
- 数据集免费提供给云相关研究者
- 使用数据集前需阅读并同意GCD协议
- 下载和使用数据集即表示同意协议中的所有限制和要求
引用
-
如果使用该数据集进行研究,请引用以下文献:
@article{liu2022ground,
title = {Ground-based Remote Sensing Cloud Classification via Context Graph Attention Network},
author = {Liu, Shuang and Duan, Linlin and Zhang, Zhong and Cao, Xiaozhong and Durrani, Tariq S.},
journal = {IEEE Transactions on Geoscience and Remote Sensing},
volume = {60},
pages = {1-11},
year = {2022},
publisher = {IEEE}
}
下载
- 下载链接:Google Drive

学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录
WideIRSTD Dataset
WideIRSTD数据集包含七个公开数据集:SIRST-V2、IRSTD-1K、IRDST、NUDT-SIRST、NUDT-SIRST-Sea、NUDT-MIRSDT、Anti-UAV,以及由国防科技大学团队开发的数据集,包括模拟陆基和太空基数据,以及真实手动标注的太空基数据。数据集包含具有各种目标形状(如点目标、斑点目标、扩展目标)、波长(如近红外、短波红外和热红外)、图像分辨率(如256、512、1024、3200等)的图像,以及不同的成像系统(如陆基、空基和太空基成像系统)。
github 收录
Nexdata/chinese_dialect
该数据集包含25,000小时的中文方言语音数据,收集自多个方言区域的本地方言使用者,涵盖闽南语、粤语、四川话、河南话、东北话、上海话、维吾尔语和藏语等。数据格式为16kHz、16bit、未压缩的wav文件,单声道。句子准确率超过95%。数据集支持的任务包括自动语音识别(ASR)和音频说话人识别。
hugging_face 收录