Git-10M|遥感数据集|地理信息系统数据集
收藏Text2Earth 数据集概述
数据集基本信息
- 数据集名称: Git-10M
- 数据集规模: 包含1000万对图像-文本对
- 数据类型: 遥感图像与文本对
- 数据特征: 包含地理位置和分辨率信息
数据集用途
- 主要用途: 用于文本驱动的遥感图像生成
- 应用场景: 遥感图像生成、图像编辑、跨模态图像生成等
数据集特点
- 全球范围: 数据集覆盖全球范围的遥感图像
- 高分辨率: 图像具有高分辨率信息
- 多样性: 包含多种类型的遥感图像(如RGB、SAR、NIR、PAN等)
相关模型
- 模型名称: Text2Earth
- 模型规模: 13亿参数
- 模型特点: 支持分辨率可控的文本到图像生成,具有强大的泛化能力和灵活性
- 主要功能:
- 零样本文本到图像生成: 无需场景特定的微调或重新训练
- 无界遥感场景构建: 克服传统生成模型的固定尺寸限制
- 遥感图像编辑: 根据用户提供的文本进行场景修改
- 跨模态图像生成: 支持多种模态的图像生成(如RGB、SAR、NIR、PAN等)
数据集与模型的性能
- 在RSICD基准数据集上的表现: Text2Earth在FID和零样本OA指标上显著优于之前的模型,分别提升了+26.23 FID和+20.95% Zero-shot OA。
数据集与模型的发布
- 发布时间: 2025年2月
- 发布状态: 数据集和模型将公开提供
引用
如果您在研究中使用了该论文,请考虑引用: bibtex @ARTICLE{xxxxxxxxxx, author={Liu, Chenyang and Chen, Keyan and Zhang, Haotian and Qi, Zipeng and Zou, Zhengxia and Shi, Zhenwei}, journal={IEEE Transactions on Geoscience and Remote Sensing}, title={Change-Agent: Toward Interactive Comprehensive Remote Sensing Change Interpretation and Analysis}, year={2024}, volume={}, number={}, pages={1-1}, keywords={Remote sensing;Feature extraction;Semantics;Transformers;Roads;Earth;Task analysis;Interactive Change-Agent;change captioning;change detection;multi-task learning;large language model}, doi={10.1109/TGRS.2024.3425815}}
许可证
- 许可证类型: MIT License
- 使用限制: 代码仅用于学术目的

网易云音乐数据集
该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。
github 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
FSDD
FSDD(Free Spoken Digit Dataset)是一个开源的语音数据集,包含由不同说话者朗读的数字0到9的音频文件。该数据集旨在用于语音识别和机器学习算法的训练和测试。
github.com 收录
PCLT20K
PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。
arXiv 收录
PlantVillage
在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。
OpenDataLab 收录