RGC-BENT
收藏arXiv2025-05-26 更新2025-05-28 收录
下载链接:
https://github.com/mirsazzathossain/RGC-Bent
下载链接
链接失效反馈官方服务:
资源简介:
RGC-BENT数据集是一个专为天文学观测中弯曲射电源分类而设计的机器学习数据集。该数据集来源于著名的射电天文调查,旨在支持NAT(窄角尾)和WAT(宽角尾)类别的分类,并包含了详细的数据处理步骤。该数据集由独立大学计算与数据科学中心、独立大学天文学、空间科学与天体物理学中心以及纽约大学阿布扎比天体物理学与空间科学中心联合创建。数据集共包含639个弯曲射电源图像,其中385个为WAT类别,254个为NAT类别。该数据集的创建过程包括了数据获取、预处理、专家验证和最终的数据集整理。通过共享该数据集和基准,旨在促进AGN分类、星系团环境和星系演化等领域的研究进展。
The RGC-BENT dataset is a machine learning dataset specifically designed for the classification of bent radio sources in astronomical observations. Derived from a renowned radio astronomical survey, this dataset aims to support the classification of NAT (Narrow-angle Tail) and WAT (Wide-angle Tail) categories, and includes detailed data processing procedures. The dataset was jointly developed by the Center for Computing and Data Sciences of an independent university, the Center for Astronomy, Space Science and Astrophysics of the same independent university, and the Center for Astrophysics and Space Science at New York University Abu Dhabi. The dataset contains a total of 639 bent radio source images, among which 385 belong to the WAT category and 254 belong to the NAT category. The development process of this dataset includes data acquisition, preprocessing, expert validation, and final dataset curation. By sharing this dataset and its benchmark, the goal is to advance research progress in fields such as AGN classification, galaxy cluster environments, and galaxy evolution.
提供机构:
独立大学计算与数据科学中心, 独立大学天文学、空间科学与天体物理学中心, 纽约大学阿布扎比天体物理学与空间科学中心
创建时间:
2025-05-26
搜集汇总
数据集介绍

构建方式
RGC-BENT数据集的构建基于Faint Images of the Radio Sky at Twenty-cm (FIRST) 射电天文巡天数据,通过Sasmal等人编目的源坐标获取原始图像。数据处理采用PyBDSF软件包进行背景估计、源识别和掩模生成等关键步骤。背景估计通过局部像素强度分析实现,源识别则采用双阈值策略检测显著辐射区域,并辅以二维高斯模型拟合提取形态参数。最终生成的二进制掩模通过形态学膨胀优化后,与原始图像相乘实现背景扣除。所有图像经专家验证后按9:1比例分层划分为训练集与测试集,确保WAT和NAT类别的均衡分布。
特点
该数据集包含639张经专业天文学家标注的弯曲射电活动星系核图像,其中WAT类385例,NAT类254例,涵盖150×150像素的灰度图像及对应掩模。其核心价值在于首次系统性地标注了窄角尾(NAT)和宽角尾(WAT)两种弯曲射电AGN亚型,填补了该领域专用机器学习数据集的空白。数据采用FITS和PNG双格式存储,并经过背景扣除和专家质量筛选,确保样本的物理真实性和形态特征完整性。与Galaxy Zoo等通用星系数据集相比,RGC-BENT针对射电喷流弯曲机制研究提供了更专业的标注维度。
使用方法
该数据集适用于监督学习框架下的图像分类任务,输入为150×150像素单通道图像,建议上采样至224×224像素以适应主流CNN架构。基准实验表明,ConvNeXT等现代卷积神经网络在该数据集表现最优(F1-score达0.87)。使用时应特别注意类别不平衡问题,建议采用F1-score作为主要评估指标而非准确率。数据已预分割为训练集(576张)和测试集(63张),可直接用于模型训练与验证。配套代码提供完整的预处理流程,包括背景估计、源提取和掩模生成等关键步骤的实现。
背景与挑战
背景概述
RGC-BENT数据集由孟加拉国独立大学计算与数据科学中心及纽约大学阿布扎比分校的天体物理学与空间科学中心的研究团队于2025年创建,旨在解决射电天文学中弯曲射电活动星系核(AGN)分类的关键问题。该数据集基于著名的FIRST射电巡天数据,专注于窄角尾(NAT)和宽角尾(WAT)星系分类,填补了天文图像分类领域缺乏专用数据集的空白。通过结合VLA观测数据与深度学习技术,该数据集为研究星系团动力学、星系演化及超大质量黑洞增长提供了重要工具,其公开共享进一步推动了跨学科研究的发展。
当前挑战
该数据集面临的核心挑战包括:1)领域问题层面,弯曲射电AGN的形态多样性(如WAT的'C'形结构与NAT的'V'形结构)对模型特征提取能力提出极高要求,且类间不平衡(WAT占比60%)加剧分类难度;2)构建过程中需克服射电图像的低信噪比特性,通过PyBDSF工具包实现背景噪声估计(公式1)、双阈值源检测(岛阈值Tisl=3与峰值阈值Tpix=5)及掩模生成(公式3)等复杂预处理步骤,而专家人工验证环节(639张图像中剔除64张低质量样本)则显著提升了数据可靠性。
常用场景
经典使用场景
RGC-BENT数据集专为弯曲射电活动星系核(AGN)的分类任务而设计,其经典使用场景主要涉及天文图像处理和机器学习模型的训练与评估。该数据集通过提供高质量的WAT(宽角尾)和NAT(窄角尾)射电星系图像,为研究人员提供了一个标准化的基准平台,用于开发和测试深度学习模型。这些模型能够自动识别和分类弯曲射电AGN的形态特征,从而显著提升天文图像分类的效率和准确性。
衍生相关工作
RGC-BENT数据集衍生了一系列经典研究工作,包括基于ConvNeXT和Swin Transformer的形态分类模型优化。相关成果被应用于改进射电星系分类流程,例如Grad-CAM可视化技术用于模型可解释性分析。数据集还启发了跨领域研究,如结合多波段数据(光学、X射线)的AGN多模态分析,以及开发针对其他射电源(如FR-I/II星系)的扩展数据集。
数据集最近研究
最新研究方向
近年来,RGC-BENT数据集在射电天文学领域引起了广泛关注,特别是在弯曲射电活动星系核(AGN)分类方面。该数据集通过整合来自FIRST巡天的射电图像,并结合专家验证,为NAT(窄角尾)和WAT(宽角尾)射电星系的分类提供了高质量的数据支持。前沿研究主要集中在利用深度学习模型(如CNN和Transformer架构)提升分类精度,并探索弯曲射电AGN与星系团动力学、星系演化之间的关联。这一数据集不仅填补了该领域专用数据集的空白,还为研究星系团内介质(ICM)的物理特性及AGN喷流的动力学行为提供了新的工具。
相关研究论文
- 1RGC-Bent: A Novel Dataset for Bent Radio Galaxy Classification独立大学计算与数据科学中心, 独立大学天文学、空间科学与天体物理学中心, 纽约大学阿布扎比天体物理学与空间科学中心 · 2025年
以上内容由遇见数据集搜集并总结生成



