CC-Foundation|遥感图像数据集|变化检测数据集
收藏CCExpert 数据集概述
数据集介绍
CCExpert 数据集是一个用于遥感变化描述的大型数据集,名为 "CC-Foundation Dataset"。该数据集旨在支持多模态语言学习模型(MLLM)在遥感变化描述任务中的能力提升。
数据集下载
数据集的部分内容已开源,可通过以下链接下载:
- Baidu NetDisk(访问码:ccmz)
数据处理步骤
- 下载并解压数据集:从上述链接下载数据集,并解压压缩包。
- 生成JSON文件:使用
add_sbsolute_path_to_all_json.py
脚本生成包含所有JSON数据文件的子文件夹,并将图像路径从相对路径转换为绝对路径。 - 更新YAML文件:使用
add_CC_Foundation_local_absolute_path_to_yaml.py
脚本将CC-Foundation的绝对路径添加到模板YAML文件中,以便查找相应的JSON标注文件。
数据集使用许可
使用该数据集时,请遵守各自数据集的许可协议。

BBGRE
The Brain & Body Genetic Resource Exchange (BBGRE) provides a resource for investigating the genetic basis of neurodisability. It combines phenotype information from patients with neurodevelopmental and behavioural problems with clinical genetic data, and displays this information on the human genome map.
国家生物信息中心 收录
Food-101
Food-101 数据集由 101 个食品类别组成,每个类别有 750 个训练图像和 250 个测试图像,总共有 101k 个图像。测试图像的标签已被手动清理,而训练集包含一些噪声。 来源:结合 Weakly 和 Webly 监督学习对食物图像进行分类
OpenDataLab 收录
Google Scholar
Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。
scholar.google.com 收录
GFS
数据来源采自美国国家环境预报中心的GFS(全球预报系统),该系统每天发布4次全球范围的气象数据,分辨率最高可达到0.25° x 0.25°。GFS数据提供FTP下载方式:https://nomads.ncep.noaa.gov/pub/data/nccf/com/gfs/。每次发布的数据保存在命名为gfs.YYYYMMDDHH的文件夹中。本次需要的数据精度为0.25°(0p25),所以数据的文件名为:gfs.t{ HH }z.pgrb2.0p25.f{ XXX }
地球大数据科学工程 收录
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录