您当前的位置: > 详细浏览

一个面向原始数据搜寻的快速射电暴数据集

A machine learning dataset for FRB detection in raw data

摘要:快速射电暴是目前国际天文学新兴前沿热点,随着海量观测数据带来的处理和分析的挑战,亟需开展快速射电暴信号智能搜寻和甄别的研究。为了加速快速射电暴搜寻研究,我们开发了一套基于机器学习的快速射电暴数据集,它可以训练机器学习算法以搜寻原始数据中的快速射电暴。目前数据集有8020个快速射电暴仿真图像、4010个非快速射电暴和4010个射频干扰仿真图像,这些图像是根据开放的快速射电暴观测结果构建的,并可根据需要扩展数量。本研究旨在为最先进的人工智能算法提供开源数据集,以测试和比较快速射电暴识别算法。该数据集为卷积神经网络和经典机器学习算法提供图像和numpy格式的文件。数据集可以实现快速射电暴和非快速射电暴分类,或快速射电暴、射频干扰和背景噪声分类。在本例中,我们使用预先训练过的31种经典卷积神经网络(CNN)。在快速射电暴/非快速射电暴分类中,在第一个历元训练中达到90-92%的准确率,在真实数据测试中达到99.8%的最大准确率。

英文摘要:We introduce a machine learning FRB dataset that can train the ML algorithms to reach the FRBs in raw data. It has 8020 FRB simulation images, 4010 non-FRB and 4010 RFI simulation images built from the public FRB observations, and can be expanded in any number as needed. This work provides an open-source dataset for state of art AI to the comparison of FRB event recognition algorithms. The dataset provides image and NumPy format files for both convolutional neural networks and classic machine learning algorithms. The dataset can implement FRB/non-FRB classification, or FRB/RFI/Blank classification. In the example, we used 31 pre-trained classic CNNs. In FRB/non-FRB classification, it achieves the accuracy of 90-92% in the first training epoch and max accuracy of 99.8% in real FRB dataset testing.

版本历史

[V1] 2022-06-28 14:27:06 chinaXiv:202206.00185V1 下载全文
点击下载全文
同行评议状态
待评议
许可声明
metrics指标
  • 点击量3946
  • 下载量99
评论
分享
邀请专家评阅