• 基于XGBoost的单脉冲信号识别研究

    分类: 天文学 >> 天文学 提交时间: 2021-06-18 合作期刊: 《天文研究与技术》

    摘要: 脉冲星搜寻是射电天文学领域的重要研究方向,随着大型射电望远镜的不断建设和发展,采集的数据呈指数级增长,如何及时从快速获取的海量数据中准确识别出脉冲星信号成为当前面临的巨大挑战。本文以LOFAR联合阵列巡天项目的观测数据为例,设计了针对单脉冲信号识别的10个特征变量,进一步研究了XGBoost结合包裹式特征选择法在单脉冲信号识别中的应用,并对比分析了GBDT、AdaBoost、随机森林和BP神经网络等模型对单脉冲信号识别的实验效果。实验结果表明,XGBoost结合包裹式特征选择法在单脉冲信号识别方面更具综合优势,其误分类率最低,同时分类结果的精确率、召回率与F1-score值都最高,平均高出其它模型1到2个百分点。从特征选择上来说,有九个特征被选为最优特征。本研究设计的特征变量和识别方法可为我国开展以FAST探测信号为主的脉冲星搜寻提供方法和技术参考。

  • 面向单脉冲信号分类的集成特征选择与评价

    分类: 天文学 提交时间: 2023-10-07 合作期刊: 《天文学报》

    摘要: 受大量射频干扰信号影响, 快速从海量观测数据中准确识别出单脉冲信号已成为天文数据处理的一项重要任务, 而设计和提取有效数据特征, 是利用机器学习进行单脉冲信号高效识别的决定因素. 针对如何选择最优特征, 进而提升单脉冲信号的分类精度这一关键问题, 设计了面向单脉冲信号分类的集成特征选择方法. 方法首先混合单脉冲信号的参数特征、统计特征和抽象特征, 然后分别利用5种单一特征选择方法选出各自的最优特征集, 最后利用贪心策略对5种单一方法获取的最优特征集进行集成筛选, 获取最优集成特征集. 实验表明, 最优特征集合既包含统计特征也包含抽象特征. 在相同特征数量下, 利用集成特征选择比单一特征选择能获得更高的模型精度, 可使F1值最高提升1.8\%. 在海量数据背景下, 集成特征选择对减少特征数量、提升分类性能和加快数据处理速度具有重要作用.