five

TransferZ

收藏
arXiv2024-11-27 更新2024-11-29 收录
下载链接:
http://arxiv.org/abs/2411.18054v1
下载链接
链接失效反馈
官方服务:
资源简介:
TransferZ数据集由加州大学洛杉矶分校的物理与天文学系创建,用于改进星系红移预测的泛化能力。该数据集包含116,335个星系的光度红移估计,这些估计基于COSMOS2020巡天的35个成像滤波器。TransferZ数据集涵盖了比光谱样本更广泛的星系类型和颜色范围,尽管其红移估计精度较低。数据集的创建过程涉及将COSMOS2020数据与HSC PDR2数据进行交叉匹配,并应用质量筛选以确保可靠的红移估计。TransferZ数据集主要应用于天体物理学和宇宙学领域,旨在解决大规模巡天中光谱数据覆盖不足的问题,从而提高光度红移模型的准确性和泛化能力。

The TransferZ dataset was created by the Department of Physics and Astronomy at the University of California, Los Angeles, to improve the generalization performance of galaxy redshift forecasting. It contains photometric redshift estimates for 116,335 galaxies, derived from 35 imaging filters of the COSMOS2020 survey. The TransferZ dataset covers a broader range of galaxy types and color distributions than spectroscopic samples, albeit with lower redshift estimation accuracy. The dataset creation process involved cross-matching COSMOS2020 data with HSC PDR2 data, and applying quality cuts to ensure reliable redshift estimates. Primarily applied in astrophysics and cosmology, the TransferZ dataset aims to address the issue of insufficient spectroscopic data coverage in large-scale surveys, thereby enhancing the accuracy and generalization performance of photometric redshift models.
提供机构:
加州大学洛杉矶分校物理与天文学系
创建时间:
2024-11-27
搜集汇总
数据集介绍
main_image_url
构建方式
TransferZ数据集的构建基于COSMOS2020调查,该调查提供了多达35个成像滤波器的测光红移估计。通过模板拟合方法,从COSMOS2020中提取了可靠的红移值,并与HSC PDR2数据进行交叉匹配,筛选出符合条件的星系,最终形成了包含116,335个星系的TransferZ数据集。此数据集不仅涵盖了更广泛的星系类型和颜色,还通过质量控制确保了红移估计的可靠性。
特点
TransferZ数据集的一个显著特点是其广泛的颜色和星系类型覆盖,相较于光谱红移样本,其红移估计虽然精度较低,但能够代表更广泛的星系群体。此外,该数据集通过结合光谱红移和测光红移,利用迁移学习方法,显著提升了红移预测的准确性和泛化能力。
使用方法
TransferZ数据集可用于训练基础神经网络模型,并通过迁移学习方法在具有更精确光谱红移的数据集上进行微调,以提高模型的性能。此外,该数据集还可用于训练结合光谱红移和测光红移的混合模型,以进一步优化红移估计的准确性。数据集已在Zenodo上公开,可通过DOI: 10.5281/zenodo.14218996获取。
背景与挑战
背景概述
TransferZ数据集由加州大学洛杉矶分校(UCLA)的物理与天文学系以及南俄勒冈大学和里士满大学的研究人员共同创建,旨在通过结合不同的地面实况和迁移学习方法,提升光度红移估计的泛化能力。该数据集基于COSMOS2020调查,包含了从多达35个成像滤波器中提取的光度红移估计,覆盖了比光谱样本更广泛的星系类型和颜色范围。TransferZ的创建旨在解决传统机器学习模型依赖于已知光谱红移训练集的局限性,这些光谱红移虽然精确,但仅代表了有限的星系样本。通过迁移学习和直接结合光度和光谱红移地面实况,TransferZ旨在使红移模型更具泛化性,以适应更广泛的星系群体。
当前挑战
TransferZ数据集面临的挑战主要集中在两个方面:一是解决光度红移估计中的泛化问题,即如何使模型在面对不同类型和颜色的星系时仍能保持高准确性;二是数据集构建过程中遇到的挑战,包括如何从多波段成像数据中准确提取红移信息,以及如何确保光度红移与光谱红移之间的良好一致性。此外,尽管TransferZ包含了更广泛的星系样本,但其红移估计的精度相对较低,这需要在模型训练和验证过程中进行有效的误差控制和校正。
常用场景
经典使用场景
TransferZ数据集在光度红移估计中展现了其经典应用场景,通过结合不同的地面实况来源和迁移学习技术,显著提升了红移预测的泛化能力。该数据集利用COSMOS2020调查的多波段成像数据,涵盖了比光谱样本更广泛的星系类型和颜色范围。研究者首先在TransferZ上训练基础神经网络,然后通过迁移学习在具有更精确光谱红移的GalaxiesML数据集上进行微调,或直接在合并的TransferZ和GalaxiesML数据集上训练。这两种方法均显著减少了GalaxiesML上的偏差、均方根误差和灾难性异常值率,尽管在TransferZ数据上的评估性能有所下降,但总体上展示了这些方法在满足宇宙学要求方面的潜力。
实际应用
TransferZ数据集在实际应用中具有广泛的前景,特别是在即将到来的大型天文调查如LSST(Legacy Survey of Space and Time)中。通过提高光度红移估计的准确性和泛化能力,该数据集能够为天文学家提供更可靠的星系距离测量,从而支持宇宙学参数的精确估计和暗物质分布的研究。此外,TransferZ的方法还可以应用于其他需要高精度红移估计的天文项目,如星系团探测和宇宙大尺度结构的分析。这些实际应用不仅提升了天文观测的科学价值,也为未来的天文数据处理技术奠定了坚实的基础。
衍生相关工作
TransferZ数据集的提出催生了一系列相关研究工作,特别是在迁移学习和混合地面实况数据的应用方面。例如,研究者们进一步探索了如何通过模拟数据和真实数据的结合来改进红移估计,以及如何将迁移学习应用于概率机器学习模型以提高科学应用的可靠性。此外,TransferZ的成功应用也激发了对模型泛化能力的深入研究,特别是在处理稀疏训练数据和高红移范围的预测精度方面。这些衍生工作不仅扩展了TransferZ的应用范围,也为未来的天文数据处理和分析提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作