您选择的条件: 吕唯佳
  • 中国SKA区域中心原型系统 -- 软件平台

    分类: 天文学 >> 天体物理学 提交时间: 2023-01-06

    摘要: 平方公里阵列(Square Kilometre Array, SKA)射电望远镜将在多个科学方向取得革命性的突破, 而SKA软件系统是影响科学产品的关键因素之一. SKA区域中心是天文学家进行SKA数据分析、科学研究和学术交流的平台. 处理SKA科学数据的软件环境需要具备通用性、灵活性和高适应性. 中国科学家已经建成了中国SKA区域中心原型机, 部署了被大型超级计算机广泛使用的作业调度系统, 并安装了能够处理当前主流射电望远镜观测数据的天文软件, 还部署了多个科学数据处理管线, 以方便不同科学方向的观测数据的自动化并行处理. 本文介绍了中国SKA区域中心原型机的软件平台和处理SKA先导望远镜数据的管线, 包括低频连续谱成像管线、谱线成像管线以及甚长基线干涉测量数据处理管线. 国内外用户已经基于该平台成功开展了SKA相关科学研究. 该平台的建设和运行为未来全面建设中国SKA区域中心提供了宝贵的实践经验.

  • 面向SKA1时代的科学数据流及阵列模拟分析

    分类: 天文学 >> 天文学 提交时间: 2022-06-28

    摘要: 作为下一代射电望远镜,平方公里阵列望远镜(SKA)经过多年的筹备,第一阶段(SKA1) 已经在2021年7月开工建设,SKA1正式运行后预计每年将产生750PB的科学归档数据,这些数据将存储在世界各地的SKA区域中心供科研工作者使用。本文将SKA观测台站、中央信号处理器、科学数据处理及区域中心等各个阶段的模型进行量化分析,以SKA1的高优先级科学观测为主要依据,得出每个阶段的数据流评估情况,以及对科学数据处理算力的需求。以当前SKA1-Low和 SKA1-Mid的阵列为例,总结了包括分辨率、灵敏度、UV覆盖等影响干涉阵列布局的关键因素;最后使用OSKAR进行干涉阵列的数据模拟,通过对SKA1-Mid的模拟得出系统的可扩展性和稳定性,通过对SKA1-Low在CSRC-P上的模拟,可以看出中国SKA区域中心原型机设计经过了充分的论证和优化,并得出了详细的算力需求以及数据量的详细信息。SKA对数据处理、计算、存储等的需求,将需要电子、通信、信息、计算机等技术和交叉学科的联合推动。

  • 中国SKA区域中心跨洲际高速数据传输进展及展望

    分类: 天文学 >> 天文学 提交时间: 2022-06-28

    摘要: 平方公里阵列望远镜(SKA)作为最大的射电望远镜,其观测产生的数据将首先由澳大利亚和南非两个台址国传输到百公里左右的科学数据处理中心,然后通过高速网络分发到上万公里距离的各个SKA区域中心。具有SKA 10%规模的SKA1阶段,每年预计有750PB的数据需要通过至少100Gbps的网络分发到各个SKA区域中心(SRC),如此高的网络带宽和数据规模对数据的传输分发带来极大挑战。本文通过对TCP/UDP/HTTP等不同网络协议的分析,并使用当前射电天文领域不同的软件进行测试和研究,得出了目前在10Gbps网络的基础设施下最佳的传输方案参数,文中讨论了影响高速传输的因素,给出了相应的性能优化的策略,在SKA1真正的观测数据产生之前,将为中国SKA区域中心的网络建设和布局提供技术基础。描述的技术细节和方法可供相关科学应用参考和使用。最后讨论并展望了未来SKA网络需求的挑战。

  • 一个面向原始数据搜寻的快速射电暴数据集

    分类: 天文学 >> 天文仪器与技术 提交时间: 2022-06-28

    摘要: 快速射电暴是目前国际天文学新兴前沿热点,随着海量观测数据带来的处理和分析的挑战,亟需开展快速射电暴信号智能搜寻和甄别的研究。为了加速快速射电暴搜寻研究,我们开发了一套基于机器学习的快速射电暴数据集,它可以训练机器学习算法以搜寻原始数据中的快速射电暴。目前数据集有8020个快速射电暴仿真图像、4010个非快速射电暴和4010个射频干扰仿真图像,这些图像是根据开放的快速射电暴观测结果构建的,并可根据需要扩展数量。本研究旨在为最先进的人工智能算法提供开源数据集,以测试和比较快速射电暴识别算法。该数据集为卷积神经网络和经典机器学习算法提供图像和numpy格式的文件。数据集可以实现快速射电暴和非快速射电暴分类,或快速射电暴、射频干扰和背景噪声分类。在本例中,我们使用预先训练过的31种经典卷积神经网络(CNN)。在快速射电暴/非快速射电暴分类中,在第一个历元训练中达到90-92%的准确率,在真实数据测试中达到99.8%的最大准确率。