davanstrien/satclip
收藏数据集卡片 for S2-100K
数据集概述
S2-100K 数据集包含 100,000 张多光谱卫星图像,这些图像从 Microsoft Planetary Computer 的 Sentinel-2 卫星采集。数据采集时间范围为 2021 年 1 月 1 日至 2023 年 5 月 17 日。该数据集在全球陆地上均匀采样,仅包含无云覆盖的图像,仅供研究使用。使用该数据集时,请引用相关论文。
数据集详情
数据集描述
SatCLIP 通过对比学习训练位置和图像编码器,通过匹配图像与其对应位置来实现。这一过程类似于 CLIP 方法,即匹配图像与其对应的文本。通过这一过程,位置编码器学习了由卫星图像表示的位置特征。
数据集来源
- Repository: [More Information Needed]
- Paper [optional]: [More Information Needed]
- Demo [optional]: [More Information Needed]
使用
直接使用
可以使用 huggingface_hub 库下载数据集:
python from huggingface_hub import snapshot_download snapshot_download("davanstrien/satclip", local_dir=., repo_type=dataset)
或者运行以下命令:
bash
确保已安装 git-lfs (https://git-lfs.com)
git lfs install git clone https://huggingface.co/datasets/davanstrien/satclip
提取图像的命令如下:
bash ls image/*.tar.xz |xargs -n1 tar -xzf
引用
BibTeX:
@article{klemmer2023satclip, title={SatCLIP: Global, General-Purpose Location Embeddings with Satellite Imagery}, author={Klemmer, Konstantin and Rolf, Esther and Robinson, Caleb and Mackey, Lester and Ru{ss}wurm, Marc}, journal={arXiv preprint arXiv:2311.17179}, year={2023} }




