单脉冲搜索作为脉冲星探测的有力工具,在探测旋转射电暂现源以及快速射电暴中扮演着重要角色。为了从海量的射电巡天数据中快速筛选出最有价值的单脉冲搜索候选体,候选体识别已经从早期启发式阈值判断发展到基于机器学习自动识别。对于FAST观测,研究了基于机器学习的单脉冲搜索候选体识别应用到CRAFTS(the commensal radio astronomy FAST survey)超宽带脉冲星数据的性能表现。在评估过程中,使用单脉冲事件组识别(SPEGID)和单脉冲搜索器(SPS)两类自动识别方法,通过7种不同机器学习分类器对CRAFTS基准数据集产生的单脉冲搜索候选体进行自动识别;作为对比,也使用了启发式阈值判断的方法(RRATtrap和Clusterrank)。结果表明,SPEGID具有最好的性能表现(最高的F1-score值95.1%、次高的召回率95.4%、最低的假阳性率4.7%),SPS具有最快的筛选速度(平均每小时筛选4010个候选体)。通过对比分析结果,探讨了如何基于FAST观测数据开展高效的单脉冲搜索候选体识别。
对大规模射电天文巡天项目产生的数据进行单脉冲搜索会产生数以亿计的脉冲星候选体。处理了500 m口径球面射电望远镜(Five-hundred-meter Aperture Spherical radio Telescope,FAST)多科学目标同时扫描巡天(The Commensal Radio Astronomy FAST Survey,CRAFTS)32万个超宽带数据文件,得到5万个脉冲星候选体。针对CRAFTS单脉冲搜索试验结果中脉冲星候选体仅有1.5%真正是脉冲星信号的问题,提出3个显著区分脉冲星信号和干扰的特征,并应用于单脉冲筛选流程。试验结果表明,改进后的单脉冲筛选工具将需要人工检查脉冲星候选体的数量降低了20%,一定程度上提高了CRAFTS巡天数据的单脉冲搜索效率。
脉冲星数据比对分析和可视化系统(PSRDB,URL:http://www.psrdb.net/),由FAST(Five-hundred-meter Aperture Spherical Radio Telescope)早期科学数据中心团队为快速开展脉冲星候选体比对分析和数据管理研发.通过前端数据提交页面,接收和维护来自FAST及其他研究机构的候选体数据.目前,PSRDB已收录自1967年人类发现第1颗脉冲星以来所有公开文献发表的2811颗脉冲星样本,并采集了当前主要巡天项目尚未正式发表的源和候选体,如FAST多科学目标同时扫描巡天(CRAFTS)候选体数据.基于入库基础数据,利用位置、周期、色散等参数进行比对分析,辅助科研工作者在线检索匹配已知星表数据,最后将检索匹配、比对分析结果生成图表供进一步分析.目前,PSRDB已被应用于FAST脉冲星搜寻和候选体数据管理.未来,PSRDB可在新源认证、后随观测、观测计划制定和原始数据处理流程设计等方面提供数据和工具支撑.