mm2025
收藏DeepSpace数据集概述
数据集基本信息
- 许可证: Apache-2.0
- 任务类别: 图像到图像、计算机视觉
- 标签: 天文学、JWST、太空、去噪、多光谱、深空、NIRCam
- 数据集名称: DeepSpace Dataset
- 数据规模: 1K<n<10K
数据集描述
DeepSpace数据集包含来自NASA詹姆斯·韦伯太空望远镜(JWST) CEERS(宇宙演化早期释放科学)计划的多光谱天文图像。该数据集专为无监督去噪和天文图像分析应用设计,保留了太空望远镜观测中固有的复杂噪声特征。
数据集详情
数据来源
- 使用NASA CEERS计划的数据,该计划是JWST研究早期宇宙星系演化的项目。
- CEERS团队提供经过校准且在不同频段像素对齐的数据。
光谱波段
数据集包含五个近红外相机(NIRCam)频段的图像:
- F115W: 1.15 μm滤波器
- F150W: 1.50 μm滤波器
- F200W: 2.00 μm滤波器
- F356W: 3.56 μm滤波器
- F444W: 4.44 μm滤波器
数据处理
- 数据源扩展: 来自CEERS FITS文件的SCI扩展,包含校准像素值
- 补丁大小: 360×360像素(非重叠补丁)
- 归一化: 使用AstroPy实现的Z-Scale归一化
数据集结构
数据划分
| 划分 | 样本数 | 百分比 | 用途 |
|---|---|---|---|
| 训练+验证 | 4200 | 80.0% | |
| 测试 | 1,050 | 20.0% |
总计: 5,250个图像补丁
划分策略:
- 80%训练+验证(4,200个补丁),20%测试(1,050个补丁)
数据实例
每个实例包含:
image: 360×360像素的天文图像补丁nircam: NIRCam标识(nircam4, nircam5, nircam8, nircam9, nircam10)filter_band: JWST滤波器波段(f115w, f150w, f200w, f356w, f444w)subfolder: 原始子文件夹标识符(1, 2, 3)patch_index: 原始图像中的顺序补丁编号split: 数据集划分分配
场景到NIRCam映射
- nircam4: scene1-4
- nircam5: scene5-6
- nircam8: scene7-8
- nircam9: scene9-12
- nircam10: scene13-16
噪声特征
数据集保留了JWST的独特噪声模式,包括:
- 十字形伪影: 频域中可见的波长依赖性噪声模式
- 相关噪声: 来自探测器特性的空间相关噪声结构
- 真实观测: 来自宇宙射线、探测器效应和背景的真实噪声
使用示例
python from datasets import load_dataset
加载完整数据集
dataset = load_dataset("username/deepspace-jwst")
加载特定划分
train_data = load_dataset("username/deepspace-jwst", split="train") val_data = load_dataset("username/deepspace-jwst", split="validation") test_data = load_dataset("username/deepspace-jwst", split="test")
示例: 按滤波器波段处理
for sample in train_data: if sample[filter_band] == f200w: image = sample[image] nircam = sample[nircam] # 在此进行分析...
引用
如果使用此数据集,请引用: bibtex @dataset{deepspace_2025, title={DeepSpace: Toward Interpretable Space Image Denoising}, year={2025}, publisher={Hugging Face Datasets}, url={https://huggingface.co/datasets/psy125/acmmm2025}, note={Derived from NASA CEERS program data} }
@misc{ceers_program, title={CEERS: The Cosmic Evolution Early Release Science Survey}, author={CEERS Team}, url={https://ceers.github.io}, note={NASA JWST Early Release Science Program} }




