five

Git-10M|遥感数据集|地理信息系统数据集

收藏
github2025-01-03 更新2025-01-04 收录
遥感
地理信息系统
下载链接:
https://github.com/Chen-Yang-Liu/Text2Earth
下载链接
链接失效反馈
资源简介:
Git-10M数据集是一个全球尺度的遥感图像-文本对数据集,包含1000万个带有地理位置和分辨率信息的图像-文本对。
创建时间:
2024-12-31
原始信息汇总

Text2Earth 数据集概述

数据集基本信息

  • 数据集名称: Git-10M
  • 数据集规模: 包含1000万对图像-文本对
  • 数据类型: 遥感图像与文本对
  • 数据特征: 包含地理位置和分辨率信息

数据集用途

  • 主要用途: 用于文本驱动的遥感图像生成
  • 应用场景: 遥感图像生成、图像编辑、跨模态图像生成等

数据集特点

  • 全球范围: 数据集覆盖全球范围的遥感图像
  • 高分辨率: 图像具有高分辨率信息
  • 多样性: 包含多种类型的遥感图像(如RGB、SAR、NIR、PAN等)

相关模型

  • 模型名称: Text2Earth
  • 模型规模: 13亿参数
  • 模型特点: 支持分辨率可控的文本到图像生成,具有强大的泛化能力和灵活性
  • 主要功能:
    • 零样本文本到图像生成: 无需场景特定的微调或重新训练
    • 无界遥感场景构建: 克服传统生成模型的固定尺寸限制
    • 遥感图像编辑: 根据用户提供的文本进行场景修改
    • 跨模态图像生成: 支持多种模态的图像生成(如RGB、SAR、NIR、PAN等)

数据集与模型的性能

  • 在RSICD基准数据集上的表现: Text2Earth在FID和零样本OA指标上显著优于之前的模型,分别提升了+26.23 FID和+20.95% Zero-shot OA。

数据集与模型的发布

  • 发布时间: 2025年2月
  • 发布状态: 数据集和模型将公开提供

引用

如果您在研究中使用了该论文,请考虑引用: bibtex @ARTICLE{xxxxxxxxxx, author={Liu, Chenyang and Chen, Keyan and Zhang, Haotian and Qi, Zipeng and Zou, Zhengxia and Shi, Zhenwei}, journal={IEEE Transactions on Geoscience and Remote Sensing}, title={Change-Agent: Toward Interactive Comprehensive Remote Sensing Change Interpretation and Analysis}, year={2024}, volume={}, number={}, pages={1-1}, keywords={Remote sensing;Feature extraction;Semantics;Transformers;Roads;Earth;Task analysis;Interactive Change-Agent;change captioning;change detection;multi-task learning;large language model}, doi={10.1109/TGRS.2024.3425815}}

许可证

  • 许可证类型: MIT License
  • 使用限制: 代码仅用于学术目的
AI搜集汇总
数据集介绍
main_image_url
构建方式
Git-10M数据集是一个全球尺度的遥感图像-文本对数据集,包含了1000万对带有地理定位和分辨率信息的图像-文本对。该数据集的构建基于广泛的遥感数据源,涵盖了多样化的地理环境和场景。通过自动化数据采集和人工标注相结合的方式,确保了数据的高质量和多样性。每一对图像和文本都经过严格的筛选和验证,以确保其准确性和一致性。
特点
Git-10M数据集的主要特点在于其全球尺度和高分辨率。数据集覆盖了广泛的地理区域,包括城市、乡村、森林、沙漠等多种地形。每张图像都配备了详细的文本描述,这些描述不仅包含地理信息,还涉及场景的语义内容。此外,数据集还提供了分辨率信息,使得研究人员能够根据需求选择不同分辨率的图像进行分析和建模。这种多样性和丰富性使得Git-10M成为遥感图像生成和理解的理想选择。
使用方法
Git-10M数据集的使用方法灵活多样,适用于多种遥感图像处理任务。研究人员可以利用该数据集进行文本驱动的图像生成、图像编辑和跨模态图像生成等任务。通过结合Text2Earth模型,用户可以实现零样本图像生成、无界遥感场景构建和遥感图像编辑等功能。数据集还支持多模态图像生成,包括RGB、SAR、NIR和PAN图像的生成与转换。使用该数据集时,建议先进行数据预处理,确保图像和文本的匹配性,然后根据具体任务选择合适的模型和算法进行实验和分析。
背景与挑战
背景概述
Git-10M数据集是由Chenyang Liu、Keyan Chen、Rui Zhao、Zhengxia Zou和Zhenwei Shi等研究人员于2025年发布的一个全球规模的遥感图像-文本对数据集。该数据集包含1000万对带有地理定位和分辨率信息的图像-文本对,旨在推动文本驱动的遥感图像生成研究。Git-10M的发布标志着遥感领域在跨模态生成任务中的重大突破,为后续的模型开发和应用提供了坚实的基础。基于该数据集,研究团队开发了Text2Earth模型,这是一个具有13亿参数的生成基础模型,能够实现分辨率可控的文本到图像生成,并在多个任务中展现出强大的泛化能力和灵活性。
当前挑战
Git-10M数据集在构建和应用过程中面临多重挑战。首先,遥感图像与文本的精确对齐是一个复杂的问题,尤其是在全球范围内收集数据时,地理信息的多样性和复杂性增加了数据标注的难度。其次,数据集的规模庞大,如何高效地存储、管理和处理这些数据成为技术上的瓶颈。此外,Text2Earth模型的开发需要解决分辨率可控生成、跨模态图像生成以及图像编辑中的视觉一致性问题,这对模型的架构设计和训练策略提出了极高的要求。最后,如何在实际应用中确保生成图像的准确性和实用性,尤其是在遥感图像的复杂场景中,仍然是一个亟待解决的挑战。
常用场景
经典使用场景
Git-10M数据集在遥感图像生成领域具有广泛的应用,特别是在文本驱动的遥感图像生成任务中。该数据集通过提供全球范围内的10百万对图像-文本对,为研究人员提供了丰富的训练数据,使得模型能够基于文本描述生成高分辨率的遥感图像。这一特性在遥感图像生成、场景构建和图像编辑等任务中展现了显著的优势。
衍生相关工作
基于Git-10M数据集,研究人员开发了Text2Earth模型,该模型在遥感图像生成任务中表现出色。Text2Earth不仅在零样本生成任务中超越了现有模型,还在遥感图像的无限扩展和编辑任务中展现了强大的能力。此外,该模型还支持跨模态图像生成,如RGB、SAR、NIR和PAN图像的生成与转换,进一步扩展了遥感图像生成的应用范围。
数据集最近研究
最新研究方向
近年来,随着遥感技术的快速发展,全球范围内的遥感图像数据量呈指数级增长。Git-10M数据集作为一个包含1000万对图像-文本对的全球尺度遥感数据集,为文本驱动的遥感图像生成提供了坚实的基础。基于该数据集开发的Text2Earth模型,凭借其13亿参数的生成基础模型,展现了在分辨率可控的文本到图像生成任务中的卓越性能。该模型不仅在零样本生成任务中显著超越了现有模型,还在无边界遥感场景构建、遥感图像编辑以及跨模态图像生成等前沿方向展现了强大的潜力。这些研究方向的突破,不仅推动了遥感图像生成技术的发展,也为地理信息系统、环境监测等领域的应用提供了新的可能性。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

网易云音乐数据集

该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。

github 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

FSDD

FSDD(Free Spoken Digit Dataset)是一个开源的语音数据集,包含由不同说话者朗读的数字0到9的音频文件。该数据集旨在用于语音识别和机器学习算法的训练和测试。

github.com 收录

PCLT20K

PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。

arXiv 收录

PlantVillage

在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。

OpenDataLab 收录