MIRAGE|多光谱图像处理数据集|计算机视觉数据集
收藏MIRAGE: 大规模对齐的RGB-热红外数据集
数据集概述
- 名称: MIRAGE (Large-Scale Aligned RGB-Thermal Infrared Dataset)
- 用途: 用于可扩展的多光谱转换研究
- 规模: 547k对齐的RGB-TIR图像对
- 特点:
- 平台多样性: CCTV、汽车、无人机、手持设备
- 场景多样性: 城市/郊区、室内/室外
- 时间多样性: 白天、中午、夜晚
- 环境多样性: 季节、天气
- 灵活色调映射: 提供8位和14位TIR图像
- 广泛基准测试: 评估最先进的GAN和扩散模型
数据集组成
户外数据集
数据集名称 | 训练集 | 测试集 | 额外数据 | 场景 | 天气 | 季节 | 地点 | 平均分辨率 |
---|---|---|---|---|---|---|---|---|
MS² | 93,746 | 18,896 | 84,358 | 校园、城市、住宅区 | 晴朗、多云、雨天 | 夏季 | 韩国 | 544 × 191 |
STHeReO | 46,437 | 9,745 | - | 校园、郊区 | 晴朗 | 夏季 | 韩国 | 601 × 245 |
ViViD | 35,796 | 14,597 | - | 校园 | 晴朗、多云 | 春季 | 韩国 | 629 × 497 |
NSAVP | 65,333 | 78,823 | - | 城市、郊区 | 晴朗、多云 | 夏季 | 韩国 | 640 × 512 |
CAMEL (Outdoor) | 8,581 | 4,482 | - | 校园、道路、城市 | 晴朗、多云、雪 | 春季、秋季、冬季 | 美国 | 404 × 230 |
TRI2I | 19,768 | 11,913 | - | 校园、道路 | 晴朗、多云 | 春季、夏季 | 美国 | 229 × 228 |
METU-VisTIR | 33 | 1,052 | - | 校园 | 晴朗 | - | 土耳其 | 632 × 497 |
MIRAGE Outdoor | 269,694 | 139,508 | 84,358 | - | - | - | - | - |
室内数据集
数据集名称 | 训练集 | 测试集 | 额外数据 | 场景 | 天气 | 季节 | 地点 | 平均分辨率 |
---|---|---|---|---|---|---|---|---|
Trimodal | 4,550 | 2,653 | - | 房间 | - | - | 奥地利 | 640 × 480 |
MultiSpectralMotion | 11,575 | 5,777 | 3,647 | 房间 | - | - | 中国 | 640 × 480 |
OdomBeyondVision | 20,904 | 4,372 | - | 房间 | - | - | 英国 | 328 × 249 |
CAMEL (Indoor) | 221 | 117 | - | 大厅 | - | - | 美国 | 404 × 230 |
MIRAGE Indoor | 37,250 | 12,919 | 88,005 | - | - | - | - | - |
总计
数据集名称 | 训练集 | 测试集 | 额外数据 |
---|---|---|---|
MIRAGE | 306,944 | 152,427 | 88,005 |
MIRAGE Raw | 278,341 | 130,491 | 88,005 |
数据集结构
MIRAGE ├── {$DATASET_NAME} | └── {$SEQUENCE_NAME} | ├── RGB | | ├── 1.jpg | | └── ... | └── TIR | ├── 1.jpg | └── ... ├── ... ├── ViVID | ├── img_campus_day1 | | ├── RGB | | | ├── 000001.png | | | └── ... | | └── TIR | | ├── 000001.png | | └── ... | ├── ... ├── ...
下载
基准评估
- 评估了最先进的RGB-TIR图像转换模型
- 评估了MIRAGE在RGB-TIR图像转换上的零样本性能
引用
@inproceedings{ }

UniProt
UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。
www.uniprot.org 收录
CosyVoice 2
CosyVoice 2是由阿里巴巴集团开发的多语言语音合成数据集,旨在通过大规模多语言数据集训练,实现高质量的流式语音合成。数据集通过有限标量量化技术改进语音令牌的利用率,并结合预训练的大型语言模型作为骨干,支持流式和非流式合成。数据集的创建过程包括文本令牌化、监督语义语音令牌化、统一文本-语音语言模型和块感知流匹配模型等步骤。该数据集主要应用于语音合成领域,旨在解决高延迟和低自然度的问题,提供接近人类水平的语音合成质量。
arXiv 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
GME Data
关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。
github 收录