A machine learning dataset for FRB detection in raw data
摘要:快速射电暴是目前国际天文学新兴前沿热点,随着海量观测数据带来的处理和分析的挑战,亟需开展快速射电暴信号智能搜寻和甄别的研究。为了加速快速射电暴搜寻研究,我们开发了一套基于机器学习的快速射电暴数据集,它可以训练机器学习算法以搜寻原始数据中的快速射电暴。目前数据集有8020个快速射电暴仿真图像、4010个非快速射电暴和4010个射频干扰仿真图像,这些图像是根据开放的快速射电暴观测结果构建的,并可根据需要扩展数量。本研究旨在为最先进的人工智能算法提供开源数据集,以测试和比较快速射电暴识别算法。该数据集为卷积神经网络和经典机器学习算法提供图像和numpy格式的文件。数据集可以实现快速射电暴和非快速射电暴分类,或快速射电暴、射频干扰和背景噪声分类。在本例中,我们使用预先训练过的31种经典卷积神经网络(CNN)。在快速射电暴/非快速射电暴分类中,在第一个历元训练中达到90-92%的准确率,在真实数据测试中达到99.8%的最大准确率。
英文摘要:We introduce a machine learning FRB dataset that can train the ML algorithms to reach the FRBs in raw data. It has 8020 FRB simulation images, 4010 non-FRB and 4010 RFI simulation images built from the public FRB observations, and can be expanded in any number as needed. This work provides an open-source dataset for state of art AI to the comparison of FRB event recognition algorithms. The dataset provides image and NumPy format files for both convolutional neural networks and classic machine learning algorithms. The dataset can implement FRB/non-FRB classification, or FRB/RFI/Blank classification. In the example, we used 31 pre-trained classic CNNs. In FRB/non-FRB classification, it achieves the accuracy of 90-92% in the first training epoch and max accuracy of 99.8% in real FRB dataset testing.
[V1] | 2022-06-28 14:27:06 | chinaXiv:202206.00185V1 | 下载全文 |
1. 天线座架非均匀温度场及热致变形研究 2022-07-29 |
2. 关于质点动力学的相对性原理的新线索 2022-07-13 |
3. 地平式太阳望远镜库德焦面指向跟踪误差建模研究 2022-06-28 |
4. 一种用于空间VLBI的射电源条纹搜索算法 2022-06-28 |
5. 银河画卷巡天实测数据分子云核智能仿真与检测系统 2022-06-28 |
6. 面向SKA1时代的科学数据流及阵列模拟分析 2022-06-28 |
7. 中国SKA区域中心跨洲际高速数据传输进展及展望 2022-06-28 |
8. 中国SKA区域中心原型系统 -- 软件平台 2022-06-25 |
9. 天马13 m射电望远镜高精度指向模型的建立 2022-06-24 |
10. 一种用于空间VLBI的射电源条纹搜索算法 2022-06-24 |