FAST-FREX|天文学数据集|射电天文学数据集
收藏RaSPDAM 数据集概述
数据集介绍
RaSPDAM 是一个基于视觉形态特征的机器学习算法,专门用于快速射电暴(FRB)的检测。该算法旨在解决传统FRB搜索方法在计算和时间上的挑战,提供显著的效率和准确性改进。
数据集背景
快速射电暴(FRB)是从遥远星系发出的短暂而强烈的射电能量脉冲。它们的发现和研究对于理解宇宙中物质的分布和演化至关重要。然而,由于射电望远镜产生的大量数据和现有搜索方法的计算复杂性,FRB的检测是一项具有挑战性的任务。传统技术在检测弱信号方面往往表现不佳,且耗时较长。
数据集内容
RaSPDAM的测试基于FAST-FREX数据集,该数据集建立在五百米口径球面射电望远镜(FAST)的观测基础上。数据集包含:
- 600个正样本:来自三个源(FRB20121102、FRB20180301和FRB20201124)的观测FRB信号。
- 1000个负样本:噪声和射频干扰(RFI)。
关键特性
效率和准确性
- 高精度:RaSPDAM的精度达到98.73%,显著优于传统方法如PRESTO和Heimdall。
- 高召回率:召回率为77.67%,有效识别出大部分真实的FRB信号。
- F1分数:F1分数为0.8694,表明在精度和召回率之间取得了良好的平衡。
多功能性
- 目前RaSPDAM提供到达时间(ToA)作为结果,未来的增强将包括色散量(DM),以进行更全面的信号验证。
性能基准
与传统方法的比较:
软件 | TN | TP | FN | FP | 召回率 | 精度 | F1分数 |
---|---|---|---|---|---|---|---|
PRESTO | 3 | 472 | 0 | 26963700 | 0.7867 | 1.7505E-05 | 3.5009E-05 |
Heimdall | 218 | 489 | 36 | 5854 | 0.8150 | 0.0771 | 0.1409 |
RaSPDAM | 989 | 466 | 128 | 6 | 0.7767 | 0.9873 | 0.8694 |
发现
自部署以来,RaSPDAM在识别以下方面发挥了重要作用:
- 2个新的FRB:FRB20211103A和FRB20230104。
- 80个脉冲星:包括13个先前未发现的脉冲星,突显了该算法在发现新天体方面的有效性。

Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录
Stanford Cars
Cars数据集包含196类汽车的16,185图像。数据被分成8,144训练图像和8,041测试图像,其中每个类被大致分成50-50。类别通常在品牌,型号,年份,例如2012特斯拉Model S或2012 BMW M3 coupe的级别。
OpenDataLab 收录
典型分布式光伏出力预测数据集
光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。
国家基础学科公共科学数据中心 收录
LFW (Labeled Faces in the Wild)
Labeled Faces in the Wild,是一个人脸照片数据库,旨在研究无约束的人脸识别问题。该数据集包含从网络收集的超过 13,000 张人脸图像。每张脸都标有图中人物的名字。照片中的 1680 人在数据集中有两张或更多张不同的照片。这些人脸的唯一限制是它们是由 Viola-Jones 人脸检测器检测到的。更多细节可以在下面的技术报告中找到。
OpenDataLab 收录
Pew Research Center Surveys
Pew Research Center Surveys 包含多个社会科学领域的调查数据,涵盖政治、社会、科技、宗教等多个主题。这些调查数据通常用于分析公众意见、态度和行为。
www.pewresearch.org 收录