five

MMM-RS|遥感数据数据集|文本到图像生成数据集

收藏
arXiv2024-10-26 更新2024-11-01 收录
遥感数据
文本到图像生成
下载链接:
https://github.com/ljl5261/MMM-RS
下载链接
链接失效反馈
资源简介:
MMM-RS数据集由南京理工大学智能感知与系统教育部重点实验室创建,是一个多模态、多GSD、多场景的遥感数据集,包含约210万条文本-图像对。数据集通过整合9个公开的遥感数据集并进行标准化处理,利用预训练的视觉-语言模型生成信息丰富的文本提示,涵盖多种地表采样距离(GSD)和环境条件。数据集的创建过程包括数据收集、标准化处理、文本提示生成和多场景图像合成。MMM-RS数据集主要应用于遥感图像的文本到图像生成任务,旨在解决现有数据集在多模态、多场景和多GSD方面的不足。
提供机构:
南京理工大学计算机科学与工程学院智能感知与系统教育部重点实验室
创建时间:
2024-10-26
AI搜集汇总
数据集介绍
main_image_url
构建方式
MMM-RS数据集的构建始于对九个公开可用的遥感(RS)数据集的收集与标准化处理。首先,这些数据集被统一调整为512×512的尺寸,以确保样本的一致性。随后,利用大规模预训练的视觉-语言模型BLIP-2,自动生成描述遥感图像内容的文本提示,并通过手工修正以确保文本信息的丰富性和准确性。此外,设计了一种地面采样距离(GSD)样本提取策略,以获取不同GSD级别的图像,并定义相应的GSD相关文本提示。最终,通过广泛的手动筛选和注释优化,形成了包含约210万对文本-图像对的MMM-RS数据集。
特点
MMM-RS数据集的显著特点在于其多模态、多GSD和多场景的特性。该数据集不仅包含RGB图像,还涵盖了合成孔径雷达(SAR)和近红外(NIR)图像,实现了多模态数据的融合。同时,数据集中的图像涵盖了从超高精度到超低精度的多种GSD级别,能够支持不同分辨率需求的应用。此外,数据集还包含了多种环境条件(如低光、雾天)下的样本,增强了模型对复杂场景的适应能力。
使用方法
MMM-RS数据集主要用于遥感图像的文本到图像生成任务。用户可以通过输入丰富的文本提示,利用预训练的扩散模型(如Stable Diffusion)生成多样化的遥感图像。数据集支持多模态、多GSD和多场景的图像生成,适用于需要高精度、多分辨率和复杂环境条件下的遥感图像生成应用。此外,数据集还可用于训练跨模态生成模型,如基于ControlNet的RGB与SAR或NIR图像之间的转换,进一步扩展了其在遥感领域的应用范围。
背景与挑战
背景概述
遥感(RS)图像作为特定领域的图像,在人类社会的可持续发展应用中发挥着重要作用,如灾害响应、环境监测、作物产量估算和城市规划。近年来,基于遥感数据的深度学习模型在场景分类、目标检测、语义分割和变化检测等计算机视觉任务中取得了显著成功。然而,这些模型在性能上受到缺乏大规模高质量数据集的限制,获取遥感图像通常既困难又昂贵。MMM-RS数据集由南京理工大学和北京空间飞行器系统工程研究所的研究团队创建,旨在解决多模态、多地面采样距离(GSD)和多场景的遥感图像生成问题。该数据集通过整合9个公开的遥感数据集,标准化处理并生成约210万对信息丰富的文本-图像对,为遥感图像生成提供了全面的基准。
当前挑战
MMM-RS数据集面临的挑战主要包括:1) 解决遥感图像生成中的多模态、多GSD和多场景问题,这些特性使得遥感图像与通用图像在尺度和视角上存在显著差异;2) 数据集构建过程中,如何有效地将遥感图像与文本语义信息结合,以及如何处理不同GSD和场景的图像合成问题。此外,由于缺乏真实世界的多场景样本,研究团队采用了现有的技术来合成不同场景的样本,这增加了数据集构建的复杂性。
常用场景
经典使用场景
MMM-RS数据集的经典使用场景在于其能够支持多模态、多地面采样距离(GSD)和多场景的遥感图像生成。通过结合大规模预训练的视觉-语言模型,该数据集能够自动生成信息丰富的文本提示,从而实现从文本到图像的生成。这使得研究人员能够在多样化的遥感场景中进行实验,包括不同天气条件和空间分辨率下的图像生成。
实际应用
MMM-RS数据集在实际应用中具有广泛的前景,特别是在灾害响应、环境监测和城市规划等领域。通过生成多样化的遥感图像,该数据集能够帮助决策者更好地理解和预测自然和人为环境的变化。此外,该数据集还可以用于训练和评估自动化系统,如无人机的路径规划和目标识别,从而提高这些系统的效率和准确性。
衍生相关工作
MMM-RS数据集的发布催生了一系列相关研究工作,特别是在遥感图像生成和跨模态生成领域。例如,基于该数据集的研究已经开发出能够生成高分辨率遥感图像的扩散模型,并展示了在不同GSD和天气条件下的生成能力。此外,该数据集还促进了跨模态生成模型的研究,如从光学图像生成合成孔径雷达(SAR)图像,进一步拓宽了遥感技术的应用边界。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Hang Seng Index

恒生指数(Hang Seng Index)是香港股市的主要股票市场指数,由恒生银行旗下的恒生指数有限公司编制。该指数涵盖了香港股票市场中最具代表性的50家上市公司,反映了香港股市的整体表现。

www.hsi.com.hk 收录

中国行政区划数据

本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。

github 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

中国陆域及周边逐日1km全天候地表温度数据集(TRIMS LST;2000-2024)

地表温度(Land surface temperature, LST)是地球表面与大气之间界面的重要参量之一。它既是地表与大气能量交互作用的直接体现,又对于地气过程具有复杂的反馈作用。因此,地表温度不仅是气候变化的敏感指示因子和掌握气候变化规律的重要前提,还是众多模型的直接输入参数,在许多领域有广泛的应用,如气象气候、环境生态、水文等。伴随地学及相关领域研究的深入和精细化,学术界对卫星遥感的全天候地表温度(All-weather LST)具有迫切的需求。 本数据集的制备方法是增强型的卫星热红外遥感-再分析数据集成方法。方法的主要输入数据为Terra/Aqua MODIS LST产品和GLDAS等数据,辅助数据包括卫星遥感提供的植被指数、地表反照率等。方法充分利用了卫星热红外遥感和再分析数据提供的地表温度高频分量、低频分量以及地表温度的空间相关性,最终重建得到较高质量的全天候地表温度数据集。 评价结果表明,本数据集具有良好的图像质量和精度,不仅在空间上无缝,还与当前学术界广泛采用的逐日1 km Terra/Aqua MODIS LST产品在幅值和空间分布上具有较高的一致性。当以MODIS LST为参考时,该数据集在白天和夜间的平均偏差(MBE)为0.09K和-0.03K,偏差标准差(STD)为1.45K和1.17K。基于19个站点实测数据的检验结果表明,其MBE为-2.26K至1.73K,RMSE为0.80K至3.68K,且在晴空与非晴空条件下无显著区别。 本数据集的时间分辨率为逐日4次,空间分辨率为1km,时间跨度为2000年-2024年;空间范围包括我国陆域的主要区域(包含港澳台地区,暂不包含我国南海诸岛)及周边区域(72°E-135°E,19°N-55°N)。本数据集的缩写名为TRIMS LST(Thermal and Reanalysis Integrating Moderate-resolution Spatial-seamless LST),以便用户使用。需要说明的是,TRIMS LST的空间子集TRIMS LST-TP(中国西部逐日1 km全天候地表温度数据集(TRIMS LST-TP;2000-2024)V2)同步在国家青藏高原科学数据中心发布,以减少相关用户数据下载和处理的工作量。

国家青藏高原科学数据中心 收录