分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2022-06-28
平方公里阵列 (Square Kilometre Array, SKA) 射电望远镜的数据处理是通过管线方式进行的, 管 线的执行效率是 SKA 区域中心考虑的重要因素. 连续谱成像观测是 SKA 的主要观测模式之一, 也是许 多科学工作的基础. 本文以 SKA 低频先导设备 (Murchison Widefield Array, MWA) 的成像管线为例, 在 中国 SKA 区域中心原型机 (China SKA Regional Centre prototype, CSRC-P) 上进行并行处理管线优化. 以往的优化方案都集中在少数性能热点, 缺乏对整体管线的系统优化, 导致整体加速比相对较低. 针对这一 问题, 本文提出了一种全局优化方案, 针对管线使用多种编程语言、图像数据可独立处理的特点, 综合使用 C + + 多线程、Python 多进程、Shell 多任务并行等优化方法, 并验证了优化结果的准确性. 实验表明, 优 化后的代码在 CSRC-P 的 x86 节点和 ARM 节点上分别获得了 2.7 和 2.4 倍加速. ARM 计算节点展现出 对 SKA 应用良好的适应性. 本文的优化策略和方法也适用于其他 SKA 科学应用, 对 SKA 先导望远镜的 科学运行和未来的运行有帮助.
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2022-06-28
随着平方公里阵列射电望远镜(SKA)等大科学装置的建设和运行,以及大数据和高性能计算创 新平台的提出,天文学与高性能计算之间的联系日趋紧密. 天文学计算,特别是作为 SKA 的主要科学方 向之一的脉冲星搜索,具有数据量大、计算量多的特点. 本文介绍了一种基于 OpenMP 多线程和多进程 技术来加速脉冲星搜索流程的方案,提出了一种解决负载不平衡问题的方法,并成功的将优化流程安装于 中国 SKA 区域中心原型机的 x86 和 ARM 计算节点. 通过默奇森大视场阵列望远镜(MWA)的脉冲星观 测数据搜寻测试,与原始单线程方法相比,流程分别获得 10.4–12.2 和 24.5–27.6 倍的加速比. 其中 ARM 平台比 x86 平台的计算快 1.1–1.3 倍,显示出其在 SKA 数据处理方面的巨大潜力. 在中国 SKA 区域中心 原型机上部署的脉冲星优化搜索流程,近期将重点应用于 MWA 南天快速两米巡天(SMART)项目的低 频脉冲星搜寻,以满足包括引力波探测计时阵在内的多种科学需要。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2022-01-02
摘要: [目的]当标注数据较少时,现有模型受训练数据量少的限制,参数没有拟合到预期效果,导致在低资源命名实体识别任务中模型识别性能不佳。[方法]本文提出一种融入伯努利分布(Bernoulli distribution)的新型损失函数,让模型较好拟合数据。此外,本文在BiLSTM-CRF模型基础上融合多层字符特征信息,结合基于伯努利分布的新型损失函数,构建了BiLSTM-BCRF模型。[结果]本文提出的BiLSTM-BCRF模型在20%的CoNLL2003和20%的BC5CDR的数据集上,F1值在BiLSTM-CRF模型基础上分别提升了6.16%、3.35%。[结论]该模型能较好地适应低资源命名实体识别任务。[局限]该模型识别专有名词的性能还有待提升。
分类: 计算机科学 >> 计算机科学技术其他学科 分类: 心理学 >> 心理学其他学科 提交时间: 2021-12-21
摘要: Game map is an important human-computer interactive content-bearing platform in major games. With the application of cellular automata(CA) and Procedural Content Generation (PCG)in map generation, the spatial scale and data volume of current game maps are increasing greatly, while in game map test procedure, automatic methods such as interactive test script are inadequate both in depth and application breadth, especially in the lack of game map evaluation from player experience perspective. This research proposes an automatic game map test method based on agent reinforcement learning. By establishing agents’ interactive action models standing for different types of players’ behaviors in the map, universal evaluation of the map environment is enhanced through agent actions, which can optimize game map design from the perspective of player experience with quantitative value of inferiority. Finally, our campus scenes in Minecraft were used as the experimental environments to verify the effectiveness of the method.
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2021-12-20
摘要: 针对现有基于Tacotron模型的蒙古语语音合成系统存在的两个问题:1)难以实时合成;2)合成语音保真度较低,该文基于FastSpeech2模型提出了完全非自回归的实时、高保真蒙古语语音合成模型MonTTS。为了提高MonTTS模型合成蒙古语语音的韵律自然度/保真度,根据蒙古语声学特点提出以下三点创新改进:1)使用蒙古文音素序列来表征蒙古文发音信息;2)提出音素级的声学调节器以学习长时韵律变化;3)提出基于蒙古语语音识别和自回归语音合成两种时长对齐方法。同时,该文构建了一个当前最大规模的蒙古语语音合成数据库:MonSpeech。实验结果表明MonTTS在韵律自然度方面的主观平均意见分数(Mean Opinion Score,MOS)达到4.53,显著优于当前最优的基于Tacotron的蒙古语语音合成基线系统和基线FastSpeech2模型;MonTTS合成实时率达3.63×10-3,满足实时高保真合成要求。最后,文中涉及的训练脚本和预训练模型全部开源(https://github.com/ttslr/MonTTS)。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2021-11-25
摘要: 驾驶人是“人-车-环境”道路交通系统的核心,研究驾驶人的感知-行为模式对于规范驾驶行为、提高安全水平具有重要意义。然而,当前的研究很少涉及驾驶中头动与器官协调性,尤其缺乏量化计算的研究。因此,本文设计了虚拟现实下的匀速平稳驾驶实验,并使用信息论工具进行建模、分析。我们研究了头、眼、手、脚四种运动器官的协调性,提出了基于传递熵的因果网络用来描述四者间的协作模式,提出了使用网络平均传递熵作为评估驾驶中器官协调性的一种指标。最后,我们还发现,在驾驶中头-眼协调性非常强,配合紧密度高;在转弯时各器官间的协调性比在直行时强;在平稳匀速驾驶任务中,驾驶人对行为任务的优先级高于感知任务。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2021-10-21
摘要: 主动信息存储是重要的信息论工具,其优点在于易于获取复杂在系统中的可解释的信息存储。驾驶员的头动行为对于其把控方向具有重要作用,然而这种作用没有得到量化的衡量与解释。在本文中,我们将主动信息存储应用在驾驶员头动研究上,研究其与驾驶方向平稳度的关系。具体而言,我们设计了包含直道和转弯的VR驾驶实验,获取驾驶员头动主动信息存储序列和车辆偏转角序列,并研究二者的量化关系。我们证明了二者具有高度的时序相关性,并且用二者的联合熵作为驾驶表现的一种指标,最后我们用驾驶员的头动实时预测车辆偏转角,得到了88.56%的准确率。该工作有望帮助监测驾驶员状态,提高驾驶安全性。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2021-10-07
摘要: 区块链是随着比特币等数字加密货币的日益普及而逐渐兴起的一种全新的去中心化基础架构与分布式计算范式, 目前已经引起政府部门、金融机构、科技企业和资本市场的高度重视与广泛关注。以比特币为代表的数字货币在获得巨大成功的同时,也具有许多缺陷并带来了一系列社会问题。本文提出了新的数字货币与非对称代币(NFT)发行模式,可以有效的弥补当前数字货币的缺陷并使其创造更大的社会价值。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2021-10-01
摘要: 非侵入式负荷分解能够充分解析用户用电数据,是分析评估用户柔性调控潜力的关键技术。鉴于深度学习方法在负荷分解的广泛应用,首先深入探讨了降噪自编码器、循环神经网络、卷积神经网络等主流深度学习网络结构应用在负荷分解问题时的工作机理,并对它们在负荷分解领域中的应用与发展进行了展望分析;之后,提出了基于不同维度的分解算法评价框架,并补充了评价过程中测试数据的选择规范;最后,利用该评价框架对主流的深度学习分解模型进行评价,并对模型代码进行了开源,评价结果证明所提框架更能综合地评价给定超参设置下的深度学习分解模型,并揭示模型性能关于网络结构、特征输入等因素的敏感性。
分类: 计算机科学 >> 计算机科学技术其他学科 分类: 信息科学与系统科学 >> 信息与系统科学其他学科 提交时间: 2021-08-17
摘要:Starting from finding approximate value of a function, introduces the measure of approximation-degree between two numerical values, proposes the concepts of "strict approximation" and "strict approximation region", then, derives the corresponding one-dimensional interpolation methods and formulas, and then presents a calculation model called "sum-times-difference formula" for high-dimensional interpolation, thus develops a new interpolation approach ADB interpolation. ADB interpolation is applied to the interpolation of actual functions with satisfactory results. Viewed from principle and effect, the interpolation approach is of novel idea, and has the advantages of simple calculation, stable accuracy, facilitating parallel processing, very suiting for high-dimensional interpolation, and easy to be extended to the interpolation of vector valued functions. Applying the approach to instance-based learning, a new instance-based learning method learning using ADB interpolation is obtained. The learning method is of unique technique, which has also the advantages of definite mathematical basis, implicit distance weights, avoiding misclassification, high efficiency, and wide range of applications, as well as being interpretable, etc. In principle, this method is a kind of learning by analogy, which and the deep learning that belongs to inductive learning can complement each other, and for some problems, the two can even have an effect of “different approaches but equal results” in big data and cloud computing environment. Thus, the learning using ADB interpolation can also be regarded as a kind of “wide learning” that is dual to deep learning.
分类: 计算机科学 >> 计算机科学技术其他学科 分类: 能源科学 >> 能源(综合) 提交时间: 2021-08-11
摘要:负荷预测是电网系统中很多应用的关键部分,具有重要作用。然而,由于电网负荷的非线性、时变性和不确定性,使得准确预测负荷具有一定的挑战。充分挖掘负荷序列的潜在特征是提升预测准确率的关键。本文认为在特征提取时应该充分利用负荷序列的位置信息、趋势性、周期性和时间信息,同时还应构建更深层次的神经网络框架进行特征挖掘。因此,本文提出了基于特征嵌入和Transformer框架的负荷预测模型,该模型由特征嵌入层,Transformer层和预测层组成。在特征嵌入层,模型首先对历史负荷的位置信息、趋势性、周期性和时间信息进行特征嵌入,然后再与天气信息进行融合,得到特征向量。Transformer层则接受历史序列的特征向量并挖掘序列的非线性时序依赖关系。预测层通过全连接网络实现负荷预测。从实验结果来看,本文模型的预测性能优于对比模型,体现了该模型的可行性和有效性。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2021-06-03
摘要: Complex evidence theory has been applied to several fields due to its advantages in modeling and processing uncertain information. However,to measure the uncertainty of the complex mass function is still an open issue. The main contribution of this paper is to propose a complex-valued Deng entropy. The complex-valued Deng entropy can effectively measure the uncertainty of the mass function in the complex-valued framework. Meanwhile, the complex-valued Deng entropy is a generalization of the Deng entropy and Shannon entropy. That is, the complex-valued Deng entropy can degenerate to classical Deng entropy when the complex-valued mass function degenerates to a mass function in real space. In addition, the proposed complex-valued Deng entropy can also degenerates to Shannon entropy when the complex-valued mass function degenerates to a probability distribution in real space. Some numerical examples demonstrate the compatibility and effectiveness of the complex-valued Deng entropy.
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2021-05-31
摘要: Complex-valued expression models have been widely used in the application of intelligent decision systems. However, there is a lack of entropy to measure the uncertain information of the complex-valued probability distribution. Therefore, how to reasonably measure the uncertain information of the complex-valued probability distribution is a gap to be filled. In this paper, inspired by the Renyi entropy, we propose the Complex-valued Renyi entropy, which can measure uncertain information of the complex-valued probability distribution under the framework of complex numbers, and is also the first time to measure uncertain information in the complex space. The Complex-valued Renyi entropy contains the features of the classical Renyi entropy, i.e., the Complex-valued Renyi Entropy corresponds to different information functions with different parameters q. Meanwhile, the Complex-valued Renyi entropy has some properties, such as non-negativity, monotonicity, etc. Some numerical examples can demonstrate the flexibilities and reasonableness of the Complex-valued Renyi entropy.
分类: 心理学 >> 生理心理学 分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2020-08-07
摘要: 神经科学对人工智能有很大的启发作用,通过借鉴上述学科的研究成果,我们设计了一种新的人工神经网络来对人脑内的杏仁核进行模拟。人工神经网络包含长时记忆网络和激活网络两个部分,记忆网络记录了发送信号和接收信号的神经元以及二者之间的权重,激活网络则记录了发送信号和接收信号的神经元及其信号发送的时间点。激活网络仅保留了事件发生时的一小段记忆,并会根据设定好的规则修改长时记忆网络中的权重。利用此类方法,我们成功地让智能体拥有了恐惧情绪学习和经典条件反射式学习的能力,这与生物体内杏仁核的功能非常类似。
分类: 计算机科学 >> 计算机科学技术其他学科 分类: 信息科学与系统科学 >> 信息与系统科学其他学科 提交时间: 2020-07-29
摘要: 目前诸多模式识别任务的识别精度获得不断提升,在一些任务上甚至超越了人的水平。单从识别精度的角度来看,模式识别似乎已经是一个被解决了的问题。然而,高精度的模式识别系统在实际应用中依旧会出现不稳定和不可靠的现象。因此,开放环境下的鲁棒性成为制约模式识别技术发展的新瓶颈。实际上,在大部分模式识别模型和算法背后蕴含着三个基础假设:封闭世界假设、独立同分布假设、以及大数据假设。这三个假设直接或间接影响了模式识别系统的鲁棒性,并且是造成机器智能和人类智能之间差异的主要原因。本文简要论述如何通过打破三个基础假设来提升模式识别系统的鲁棒性。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2020-06-09
摘要: The chest X-Ray (CXR) is the one of the most common clinical exam used to diagnose thoracic diseases and abnormalities. The volume of CXR scans generated daily in hospitals is huge. Therefore, an automated diagnosis system that is able to save the effort of doctors is of great value. At present, the applications of artificial intelligence in CXR diagnosis usually use pattern recognition to classify the scans. However, such methods rely on labeled databases. They are costly and usually have a high error rate. In this work, we built a database containing more than 12,000 CXR scans and radiological reports, and developed a model based on deep convolutional neural network and recurrent network with attention mechanism. The model learns features from the CXR scans and the associated raw radiological reports directly; no additional labeling required. The model provides automated recognition of given scans and generation of impression. The quality of the generated impression was evaluated with both the CIDEr scores and by radiologists as well. The CIDEr scores were found to be around 5.8 on average for the testing dataset. Further blind evaluation suggested a comparable performance against radiologists.
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2020-03-29
摘要: 人工神经网络的模型结构与功能分别朝着多样化、智能化趋势发展,但研究者仅从解决问题结果的优劣对模型进行评估是有所欠缺、过于片面的。因此在本文中提出从仿生学的角度构建评估人工神经网络仿生度的指标集,采用定性与定量的方式对模型的仿生度进行整体分析。在定性方面,对模型的神经元方程、网络结构、权重更新原理等方面进行比较分析;在定量方面,基于仿生的角度构建指标集即小世界特性、同步特性及混沌特性,对模型进行分析,分析结果表明,LeNet5模型及BP神经网络具备同步特性,但其与真实生物神经网络仍有一定的距离,而KIII模型在结构上具备一定的小世界特性,其网络内部也表现同步特性及混沌特性,与真实的生物神经网络更为接近。
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2020-03-06
摘要: 本文提出了一种基于深度学习的自监督低照度图像增强方法。受信息熵理论和Retinex模型的启发,我们提出了一种基于信息熵最大的Retinex模型。利用该模型,一个非常简单的网络可以将照度图和反射图分离开来,且仅用低照度图像就可以进行训练。为了实现自监督学习,我们在模型中引入了一个约束条件:反射图的最大值通道与低照度图像的最大值通道一致,且其熵最大。我们的模型非常简单,不依赖任何精心设计的数据集(即使是一张低照度图像也能完成网络的训练),网络仅需进行分钟级的训练即可实现图像增强。实验证明,该方法在处理速度和效果上均达到了当前最新水平。
分类: 生物学 >> 病毒学 分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2020-02-21
摘要:新发传染病爆发流行期间,亟需提出候选药物功效与机制的科学假说。疫苗或新药研发均需要一定时间,因而药物重定位(老药新用)策略有其独特价值。但是新发疾病其病原体、宿主反应的临床数据不充分,制约了候选药物假设的提出。此阶段常根据病人临床特征进行广谱抗病毒药物的尝试。本文借鉴人工智能领域常见的启发式搜索思路,提出一种新方法(aCODE),基于前期有一定疗效提示的广谱抗病毒药,获得其宿主靶蛋白集合,在全基因组尺度上搜索与之相关性最高的基因模块组合,进而对候选化合物(如已批准上市药物、天然产物)进行模式匹配与统计检验排序。本方法可根据临床实践的进展更新输入药物,迭代输出更精准结果,输出的天然产物或中药、药食同源成分结合其它信息后可实施快速测试,形成敏捷研发测试闭环。本方法的第二版更新及其与文献证据的比对分析请参考:http://chinaxiv.org/abs/202002.00024。
分类: 心理学 >> 医学心理学 分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2019-09-28 合作期刊: 《心理科学进展》
摘要: 将机器学习应用于精神疾患的临床和基础研究是近年来的趋势。研究者将机器学习应用于精神分裂症患者及高危人群的T1加权像和弥散张量成像的脑影像数据中,为了解疾病的生理病理学机制提供帮助。回顾以往研究发现额叶及颞叶的脑结构特征具有较高的区分能力,行为数据和脑影像数据结合的分类效果优于单模态数据。现阶段研究存在样本量不足和泛化能力欠缺的局限,未来研究应注意扩大样本量、制定标准化的分类方法,从而进一步探究机器学习在精神疾患中的作用。