five

HuaYun-BJUT-MIP-Cloud-Dataset|气象学数据集|图像识别数据集

收藏
github2023-12-03 更新2024-05-31 收录
气象学
图像识别
下载链接:
https://github.com/SadaharuZL/HuaYun-BJUT-MIP-Cloud-Dataset
下载链接
链接失效反馈
资源简介:
HuaYun-BJUT-MIP-Cloud-Dataset是一个新的地面云数据集,包含25119张云图像,根据世界气象组织的分类建议分为11个不同的类别。数据集详细描述了每种云的科学名称、缩写和云特征,并提供了每种云类别的数量信息。

The HuaYun-BJUT-MIP-Cloud-Dataset is a novel ground-based cloud dataset comprising 25,119 cloud images, categorized into 11 distinct classes based on the classification recommendations of the World Meteorological Organization. The dataset meticulously details the scientific names, abbreviations, and cloud characteristics for each type, along with providing quantitative information on the number of images per cloud category.
创建时间:
2020-03-03
原始信息汇总

数据集概述

数据集名称

HuaYun-BJUT-MIP-Cloud-Dataset

数据集描述

该数据集包含25119张地面云图像,来源于HUAYUN SOUDING公司的专有设备。根据世界气象组织的分类建议,数据集将云图像分为11个不同的类别:Ac, Sc, Ns, Cu, Ci, Cc, Cb, As, No, Cs, St。

云分类标准

  • Cumulus (Cu): 具有向上圆形拱起的投影;云朵大小类似拳头;边缘清晰。
  • Cumulonimbus (Cb): 云层厚实,类似西兰花;边缘模糊。
  • Stratocumulus (Sc): 云朵通常拳头大小,分布松散,成簇、行进和波浪状,常呈灰色或灰白色。
  • Stratus (St): 云层均匀分布;覆盖大面积,几乎遍布整个天空;多为灰色。
  • Nimbostratus (Ns): 云层低且无定形;常覆盖整个天空,完全遮蔽太阳和月亮;云层蓬松且深灰色。
  • Altostratus (As): 云层较厚,覆盖整个天空;太阳透过时几乎没有光晕;云层常有条纹结构,呈灰白色或灰蓝色。
  • Altocumulus (Ac): 云朵小且轮廓分明;薄云白色,可见太阳或月亮轮廓,厚云深灰色,太阳或月亮轮廓不清晰;云朵呈椭圆形、瓦片状、鱼鳞或水波状分布。
  • Cirrus (Ci): 薄而透明;白色且有光泽;云朵呈细丝状,马尾状。
  • Cirrostratus (Cs): 云底有细丝结构;云体薄到足以让太阳和月亮透过;在阳光照射下有明显的光晕。
  • Cirrocumulus (Cc): 云朵非常小,白色且有光泽;薄白鳞片状;常排列成行和群。
  • No Cloud (No): 天空中无云。

数据集统计

  • Ac: 2256张
  • As: 2584张
  • Cb: 1392张
  • Cc: 1302张
  • Ci: 3075张
  • Cs: 2638张
  • Cu: 3100张
  • No: 3804张
  • Ns: 1236张
  • St: 1584张
  • 总计: 25119张

数据集下载

可通过提供的下载链接获取数据集:下载链接

AI搜集汇总
数据集介绍
main_image_url
构建方式
HuaYun-BJUT-MIP-Cloud-Dataset(HBMCD)是一个基于地面观测的云图像数据集,其图像来源于华云搜顶公司的专有设备。该数据集共包含25119张云图像,依据世界气象组织的云分类标准,将其划分为11个类别,包括积云、层积云、雨层云等。每张图像的分类结果均由华云搜顶公司的专业人员进行确认,确保了数据的准确性和可靠性。
特点
HBMCD数据集的特点在于其广泛的类别覆盖和高质量的图像标注。数据集不仅涵盖了常见的云类型,还包含了无云情况的图像,为云识别研究提供了全面的数据支持。此外,HBMCD与其他地面云数据集进行了对比,展示了其在类别多样性和图像数量上的优势。数据集中的每张图像均经过专业人员的严格分类,确保了标注的准确性。
使用方法
HBMCD数据集可通过GitHub页面提供的下载链接获取。研究人员可以下载数据集并用于云识别算法的开发与验证。使用该数据集时,建议引用相关论文以支持数据集的使用和传播。论文详细介绍了基于轻量级神经网络的云识别方法,为使用该数据集的研究提供了理论基础和技术参考。数据集的使用不仅限于云分类任务,还可用于气象学、环境监测等领域的研究。
背景与挑战
背景概述
HuaYun-BJUT-MIP-Cloud-Dataset(HBMCD)是由北京工业大学与华云思定公司合作创建的一个地面云图像数据集,旨在为云分类研究提供高质量的数据支持。该数据集包含25119张云图像,依据世界气象组织的分类标准,划分为11个类别,涵盖了常见的云类型如积云、层云、卷云等。HBMCD的创建时间为2020年,主要研究人员包括张磊、贾凯等,相关研究成果发表于2020年亚太信号与信息处理协会年度峰会(APSIPA ASC)。该数据集的发布为云识别领域提供了重要的数据资源,推动了基于轻量级神经网络的云识别技术的发展。
当前挑战
HBMCD数据集在解决云分类问题时面临的主要挑战包括云图像的多样性和复杂性。由于云形态多变且受光照、天气条件等因素影响,准确分类云类型具有较高的难度。此外,数据集的构建过程中也面临诸多挑战,例如云图像的采集需要依赖专业设备,且标注过程需由专业人员进行,以确保分类的准确性。与其他地面云数据集相比,HBMCD在数据规模和类别覆盖上具有优势,但仍需进一步优化数据平衡性和标注一致性,以提升模型的泛化能力。
常用场景
经典使用场景
HuaYun-BJUT-MIP-Cloud-Dataset(HBMCD)数据集在气象学和计算机视觉领域具有广泛的应用。该数据集包含了25119张地面云图,涵盖了11种不同的云类别,基于世界气象组织的分类标准。这些数据为云分类研究提供了丰富的素材,尤其是在开发自动化云识别系统时,HBMCD数据集常被用于训练和验证深度学习模型,以提高云图分类的准确性和效率。
解决学术问题
HBMCD数据集解决了云分类研究中的关键问题,尤其是在缺乏高质量、大规模标注数据的背景下。通过提供多样化的云图样本,该数据集帮助研究者克服了传统方法在云图识别中的局限性,推动了基于深度学习的云分类算法的发展。此外,HBMCD还为云图识别模型的性能评估提供了标准化的基准,促进了该领域的学术交流与技术进步。
衍生相关工作
HBMCD数据集的发布催生了一系列相关研究工作,尤其是在轻量级神经网络和云图识别算法的优化方面。例如,Zhang等人基于该数据集提出了轻量级神经网络模型,显著提升了云图分类的效率。此外,HBMCD还被用于与其他地面云图数据集的对比研究,推动了云图识别领域的标准化和数据集融合工作。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国30米分辨率土壤可蚀性因子数据集

该数据集为2018年中国30米分辨率土壤可蚀性因子(K)栅格数据,数据是利用中国1979-1994年的全国第二次土壤普查的成果数据进行计算;再利用径流小区观测数据修正计算结果;将修订结果利用反距离权重插值法插值生成栅格数据。特殊地类河湖库塘、冰川及永久积雪、裸岩土地类型K因子值强制赋值为0。如果用户采用的土地利用精度较高,建议重新对以下土地类型的K因子强制赋值为0:河湖库塘、冰川及永久积雪、裸岩。如果有K值为0,但不属于上述类型的,K因子可按如下原则:取邻近相同土地类型图斑的K值,或取与该图斑邻近且不等于0的所有图斑K值的平均值。

国家地球系统科学数据中心 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

Papersnake/people_daily_news

人民日报(1946-2023)数据集是CialloCorpus的一部分。

hugging_face 收录

CAP-DATA

CAP-DATA数据集由长安大学交通学院的研究团队创建,包含11,727个交通事故视频,总计超过2.19百万帧。该数据集不仅标注了事故发生的时间窗口,还提供了详细的文本描述,包括事故前的实际情况、事故类别、事故原因和预防建议。数据集的创建旨在通过结合视觉和文本信息,提高交通事故预测的准确性和解释性,从而支持更安全的驾驶决策系统。

arXiv 收录

China Health and Nutrition Survey (CHNS)

China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。

www.cpc.unc.edu 收录