分类: 统计学 >> 数理统计学 分类: 数学 >> 统计和概率 分类: 计算机科学 >> 计算机应用技术 分类: 信息科学与系统科学 >> 信息科学与系统科学基础学科 提交时间: 2022-07-28
摘要:统计独立性是统计学和机器学习领域的基础性概念,如何表示和度量统计独立性是该领域的基本问题。Copula理论提供了统计相关关系表示的理论工具,而Copula熵理论则给出了度量统计独立性的概念工具。本文综述了Copula熵的理论和应用,概述了其基本概念定义、定理和性质,以及估计方法。介绍了Copula熵研究的最新进展,包括其在统计学的六个基本问题(结构学习、关联发现、变量选择、因果发现、域自适应和正态性检验等)上的理论应用。讨论了前四个理论应用之间的关系,以及其对应的深层次的相关性和因果性概念之间的联系,并将Copula熵的(条件)独立性度量框架与基于核函数和距离相关的同类框架进行了对比。简述了Copula熵在理论物理学、理论化学、化学信息学、水文学、环境气象学、生态学、动物形态学、农学、认知神经学、运动神经学、计算神经学、心理学、系统生物学、生物信息学、临床诊断学、老年医学、精神病学、公共卫生学、经济学、社会学、教育学、政治学,以及能源工程、土木工程、制造工程、可靠性工程、航空航天、通信工程、测绘工程和金融工程等领域的实际应用。
分类: 计算机科学 >> 自然语言理解与机器翻译 提交时间: 2022-07-19
摘要:当标注数据较少时,现有模型受训练数据量少的限制,参数没有拟合到预期效果,导致在低资源命名实体识别任务中模型识别性能不佳。本文通过采用K折交叉验证法,使模型较好拟合数据。此外,本文在BiLSTM-CRF模型基础上融合多层字符特征信息和自注意力机制,结合K折交叉验证法,构建了CharBiLSTM-Att-CRF模型。本文提出的CharBiLSTM-Att-CRF模型在20%的CONLL2003和20%的BC5CDR的数据集上,F1值在BiLSTM-CRF模型基础上分别提升了7.00%、4.08%。该模型能较好地适应低资源命名实体识别任务。
分类: 计算机科学 >> 计算机应用技术 提交时间: 2022-07-14
目的 报纸一直是传播知识的重要载体,本文方法为实现经济、高效的报纸排版工作。
方法 首先根据历史优秀版面训练概率模型来推断电子报版面的样式,并结合固定布局约束和用户约束保证样式有效,同时构建美学设计原理的量化方法进一步实现样式微调。
结果 通过定性和定量评估,表明由本文模型推断出的样式参数精确度良好,且满足用户一定的需求。
局限 本文方法暂时只支持单页电子报的自动生成,然而报纸排版多由多个版面组成,故未来的工作需要对报纸内容进行分页操作。
结论 本文方法可以自动生成满足视觉美观性、层次性和可读性的报纸。
分类: 计算机科学 >> 计算机应用技术 提交时间: 2022-07-13
摘要:报纸版面对新闻有一个价值排序合理且美观新颖的展示,可以让读者面对众多新闻,在短时间获取最具价值的讯息和浏览乐趣。这是新闻报纸在众多媒体中的特色。然而,对于排版人员而言,手动制作直观、易读、美观的报纸版面布局往往需要耗费大量的时间成本。本文结合贝叶斯网络推断和约束规划技术,提出一种数字报版面布局自动生成方法。该方法首先基于历史版面数据驱动和专家经验对数字报版面的结构和属性建立推断模型,使得新生成的版面具有历史特定风格;然后利用推断结果建立混合整数约束规划模型计算版面布局,从而显著减少模型求解空间,提高布局质量。此外,推断模型提供多种可用候选结构为生成结果提供多样性,规划模型保证报纸版面内新闻不重叠、不溢出并具有良好的对齐性能。为了训练和验证模型,本文构建并公开了一个中文版面数据集。该数据集由数字报版面图片和相应的新闻内容组成,并带有详细版面新闻属性标记。最后,进行用户研究,结果表明了版面布局自动生成方法的有效性。
分类: 计算机科学 >> 计算机软件 提交时间: 2022-07-07
Intuitively there is drastic distinction between the “pure” decentralized block-chain systems like Defis and those that only utilizes block-chain as an enhancing technology but remains centralized with real-world business model and conventional technologies like database, application server etc. Our study explores extensively this distinction from a methodological point of view, classifies them into blockchain-complete and blockchain-partial, analyzes key features of the two types, and reveal the root cause of this distinction. We analyze the function or, in more strong words, the “ultimate purpose” of blockchain in the blockchain-partial systems, and present a conceptual model we named proof-chain that quite satisfactorily represented the general paradigm of blockchain in blockchain-partial systems. A universal tension between strength of proof-chain and privacy is then revealed and the zero-knowledge based proof-chain takes shape. Several case studies demonstrate the explaining power of our proof-chain methodology. We then apply proof-chain methodology to the analysis of the ecosystem of a collaborating group of blockchain-partial systems, representing the paradigm of public and private data domain whose border the proof-chain crosses. Finally, some derived guidelines from this methodology speaks usefulness of our methodology.
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2022-06-28
平方公里阵列 (Square Kilometre Array, SKA) 射电望远镜的数据处理是通过管线方式进行的, 管 线的执行效率是 SKA 区域中心考虑的重要因素. 连续谱成像观测是 SKA 的主要观测模式之一, 也是许 多科学工作的基础. 本文以 SKA 低频先导设备 (Murchison Widefield Array, MWA) 的成像管线为例, 在 中国 SKA 区域中心原型机 (China SKA Regional Centre prototype, CSRC-P) 上进行并行处理管线优化. 以往的优化方案都集中在少数性能热点, 缺乏对整体管线的系统优化, 导致整体加速比相对较低. 针对这一 问题, 本文提出了一种全局优化方案, 针对管线使用多种编程语言、图像数据可独立处理的特点, 综合使用 C + + 多线程、Python 多进程、Shell 多任务并行等优化方法, 并验证了优化结果的准确性. 实验表明, 优 化后的代码在 CSRC-P 的 x86 节点和 ARM 节点上分别获得了 2.7 和 2.4 倍加速. ARM 计算节点展现出 对 SKA 应用良好的适应性. 本文的优化策略和方法也适用于其他 SKA 科学应用, 对 SKA 先导望远镜的 科学运行和未来的运行有帮助.
分类: 计算机科学 >> 计算机科学技术其他学科 提交时间: 2022-06-28
随着平方公里阵列射电望远镜(SKA)等大科学装置的建设和运行,以及大数据和高性能计算创 新平台的提出,天文学与高性能计算之间的联系日趋紧密. 天文学计算,特别是作为 SKA 的主要科学方 向之一的脉冲星搜索,具有数据量大、计算量多的特点. 本文介绍了一种基于 OpenMP 多线程和多进程 技术来加速脉冲星搜索流程的方案,提出了一种解决负载不平衡问题的方法,并成功的将优化流程安装于 中国 SKA 区域中心原型机的 x86 和 ARM 计算节点. 通过默奇森大视场阵列望远镜(MWA)的脉冲星观 测数据搜寻测试,与原始单线程方法相比,流程分别获得 10.4–12.2 和 24.5–27.6 倍的加速比. 其中 ARM 平台比 x86 平台的计算快 1.1–1.3 倍,显示出其在 SKA 数据处理方面的巨大潜力. 在中国 SKA 区域中心 原型机上部署的脉冲星优化搜索流程,近期将重点应用于 MWA 南天快速两米巡天(SMART)项目的低 频脉冲星搜寻,以满足包括引力波探测计时阵在内的多种科学需要。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-06-06 合作期刊: 《计算机应用研究》
摘要:暗光环境拍摄的图像通常存在昏暗、噪声、偏色等退化问题。为此,提出一种基于差分特征的可见光与近红外融合方法。首先,观察到近红外与可见光图像成像不一致性,通过两者结构性差异构造差分特征。其次,利用差分特征映射为融合权重进行权重融合。最后,采用偏色校正方法对融合后易产生偏色区域进行亮度复原,使得融合后偏色区域颜色真实自然。提出方法能切实有效地利用近红外信息,输出高质量清晰图像。实验结论表明,本文方法在主管感受和客观评价上均优于现有算法。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-06-06 合作期刊: 《计算机应用研究》
摘要:为解决目前ViT模型无法改变输入补丁大小且输入补丁都是单一尺度信息的缺点,提出了一种基于Transformer的图像分类网络称为MultiFormer。MultiFormer通过AWS(Attention With Scale)模块,将每阶段不同尺度输入小补丁嵌入为具有丰富语义信息的大补丁;通过GLA-P(Global-Local Attention With Patch)模块交替捕获局部和全局注意力,在嵌入时同时保留了细粒度和粗粒度特征。设计了MultiFormer-Tiny、-Small和-Base三种不同变体的MultiFormer模型网络,在ImageNet图像分类实验中Top-1精度分别达到81.1%、82.2%和83.2%,后两个模型对比同体量的卷积神经网络ResNet-50和ResNet-101提升3.1%和3.4%;对比同样基于Transformer分类模型ViT,MultiFormer-Base在参数和计算量远小于ViT-Base/16模型且不需要大量数据预训练前提下提升2.1%。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-06-06 合作期刊: 《计算机应用研究》
摘要:小样本材料图像分割是图像分割领域的研究难点之一。材料图像的微观结构大多数有形状各异、纹理复杂和边界模糊等特点,会导致材料图像的分割不准确。Graph-UNet被提出融合UNet和图卷积神经网络来解决小样本材料图像自动分割的挑战,它将卷积神经网络的多维特征融合和跳跃连接的思想迁移到图卷积神经网络中实现图卷积和图注意力的有效结合,并且建立了一个通用的模块实现特征图和图结构相互转换。在材料图像数据集上进行了对比和消融实验,证明Graph-UNet的分割结果优于很多先进方法,准确的识别了多种材料结构,推动了探究材料结构和性能关系的发展。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-06-06 合作期刊: 《计算机应用研究》
摘要:为提高机器人在移动路径中对道路坡度的估计精度,提出一种面向应用的RGB-D(Red Green Blue-Depth)机器人融合型道路坡度估计方法。首先,引入随机采样一致性算法完成点云处理;其次,采用改进型平面拟合方法完成法向量估计;最后,采用余弦聚类及累加平均方法实现高精度道路坡度估计。实验结果表明,该算法在数据集下相较最小二乘法与稀疏子空间法,估计误差分别降低1.21%、2.13%,在实际环境下较最小二乘法平均误差降低1.43°,这证明了所提方法的可行性和准确性。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-06-06 合作期刊: 《计算机应用研究》
摘要:魏松杰等人提出一种基于安全仲裁SEM(Security Mediator)的mIBS(identity based signature)方案,利用SEM节点实现用户身份实时撤销。mIBS方案中,SEM持有部分用户私钥,与签名者共同完成签名。文章对mIBS方案进行了安全性分析,发现该方案存在严重安全缺陷,并给出一个具体的攻击实例。在攻击实例中,签名者通过与SEM的一次正常签名交互,窃取SEM持有的部分私钥,进而绕开SEM单独实施签名,使得SEM失效。文章提出一种改进的mIBS方案(记为mIBSG),对SEM持有的部分私钥增加了随机性保护。进一步,文章建立了mIBS方案安全模型mEUF-CMIA(existential unforgeability under adaptive chosen message and identity attacks),重点讨论了其敌手模型。除传统IBS敌手外,mEUF-CMIA模型定义第2种类型敌手模拟一个恶意但合法的签名者,通过访问随机预言机,在没有SEM参与的情况下独立产生签名。在mEUF-CMIA模型下,mIBSG方案的不可伪造性被规约为求解循环群上的CDH问题。对比分析表明,mIBSG方案以较小的计算代价实现了可证明安全性。mIBSG方案可用于构建基于IBC的跨域认证系统。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-06-06 合作期刊: 《计算机应用研究》
摘要:针对天鹰优化器(Aquila Optimizer,AO)虽然拥有强大的全局勘探能力,但局部开发能力不足的问题,提出融合差分变异和切线飞行的天鹰优化器(Differential Evolution mutation and tangent flight Aquila Optimizer,DEtanAO)。首先,根据差分进化算法中的变异操作能使算法具有较强的开发能力弥补了AO算法的不足,然后,利用切线搜索算法中切线飞行策略具有较强的探索搜索空间的能力并能使算法跳出局部最优解的优势,用其替换了AO算法中的莱维飞行。这两种策略的结合有效地平衡了DEtanAO算法的勘探和开发阶段。最后,为验证DEtanAO算法的优化性能,在12个标准基准函数、高维函数、Wilcoxon秩和检验和工程优化问题上来测试所改进算法的寻优能力。实验结果表明,相比其他新提出的智能算法,DEtanAO算法具有更强的寻优能力和更快的收敛速度。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-06-06 合作期刊: 《计算机应用研究》
摘要:针对阿奎拉优化算法(AO)存在的不足,提出一种采用混合搜索策略的阿奎拉优化算法(HAO)。首先,利用动态调整函数平衡算法的全局探索与局部开发;其次,利用混沌自适应权重来增强算法的全局搜索能力、加快算法的收敛速度;最后,设计新的个体变异概率系数,采用改进型差分变异策略,利用适应度值较优个体引领群体中其他个体开展搜索活动,保持了种群的多样性,增强了算法跳出局部最优能力。通过8个基准测试函数和10个CEC2019测试函数,以及1个工程应用问题的数值实验仿真,实验结果表明,算法的全局收敛速度和优化精度均得到了明显地改善,跳出局部最优的能力得到了增强。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-06-06 合作期刊: 《计算机应用研究》
摘要:调头任务是自动驾驶研究的内容之一,大多数在城市规范道路下的方案无法在非规范道路上实施。针对这一问题文中建立了一种车辆掉头动力学模型,并设计了一种多尺度卷积神经网络提取特征图作为智能体的输入。另外文中还针对调头任务中的稀疏奖励问题,结合分层强化学习和近端策略优化算法提出了分层近端策略优化算法,在简单和复杂场景的实验中,该算法相比于其他算法能够更快的学习到策略,并且具有更高的掉头成功率。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-06-06 合作期刊: 《计算机应用研究》
摘要:在基于属性访问控制中策略中,如何快速响应检索的访问控制请求至关重要,而通过遍历策略集合每条规则中的所有的属性值去匹配相应规则的检索方法是低效的。因此,论文提出一种基于二进制序列的属性访问控制策略检索方法。采用二进制标识和二进制编码表示基于属性的访问控制策略和访问控制请求。通过对二进制标识的逻辑运算选择合适的分组,在组内,通过访问控制请求的二进制编码和所有规则的二进制编码的匹配来查找合适的规则,减少策略集合内规则的属性与访问控制请求属性匹配的过程,从而提高策略检索效率。论文在实验中从策略预处理、策略评估时间和策略检索总时间三个方面类比相似检索方法的效率,实验结果表明,论文提出的策略检索方法具有更高的检索效率。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-06-06 合作期刊: 《计算机应用研究》
摘要:在有限能耗下提高任务执行效率是无人机系统中一个关键问题,然而现有的无人机任务分配方法忽视了任务与无人机巡航方向的相关性对能耗和时延的影响。为此,提出一种基于任务与巡航方向相关性分析的无人机任务分配方法,该方法包括任务筛选和基于共识的冲突解决两个阶段。在第一阶段,该方法首先利用任务与无人机巡航方向的夹角为单个无人机筛选出无折返任务,然后提出兼顾能耗和时间紧迫性的任务筛选算法从无折返任务中筛选出交互前候选任务。在第二阶段,该方法在多个无人机交互候选任务列表后,根据任务在这多个无人机巡航方向上的能耗效用参数和时延评估值来解决它们之间的任务冲突。经实验验证,提出的方法能够获得更低的任务平均能耗和平均时延。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-06-06 合作期刊: 《计算机应用研究》
摘要:单应估计是许多计算机视觉任务中的一个基础且重要的步骤。传统单应估计方法基于特征点匹配,难以在弱纹理图像中工作。深度学习已经应用于单应估计以提高其鲁棒性,但现有方法均未考虑到由于物体尺度差异导致的多尺度问题,因此精度受限。针对上述问题,提出了一种用于单应估计的多尺度残差网络。该网络能够提取图像的多尺度特征信息,并使用多尺度特征融合模块对特征进行有效融合,此外还通过估计四角点归一化偏移进一步降低了网络优化难度。实验表明,在MS-COCO数据集上,该方法平均角点误差仅为0.788个像素,达到了亚像素级的精度,并且在99%情况下能够保持较高的精度。由于综合利用了多尺度特征信息且更容易优化,该方法精度显著提高,并具有更强的鲁棒性。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-06-06 合作期刊: 《计算机应用研究》
摘要:基于视频的人体行为识别任务中由于大部分画面并不包含重要的判别信息,这对识别应用的准确性造成严重干扰。关键姿态帧既能表达视频又能降低计算量,且骨骼数据相比于图像包含更多维度的信息。因此,提出一种基于关键帧骨骼节点自适应分区与关联的行为识别算法。首先构建自适应池化深度网络以评估帧的重要性获取关键姿态帧序列;其次通过节点自学习模型建立非自然连接状态下的节点间关联;最后将改进的时空信息应用于STGCN并使用SoftMax分类识别。在开源的大规模数据集NTU-RGB+D和Kinetics 上与几种典型技术进行比对,验证了所提方法在减少冗余数据量的同时能保留关键动作信息,且动作识别准确率平均提高了0.63%~11.81%。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-06-06 合作期刊: 《计算机应用研究》
摘要:位姿图优化(pose graph optimization,PGO)是计算机视觉领域中广泛应用的高维非凸优化算法,很难直接求解,主要依赖于迭代技术,对初始值的质量要求较高,在实践中很难得到保证。针对位姿图优化问题进行了研究,提出了基于特征分解的位姿图简单封闭解算法,该算法首先对PGO问题的最大似然估计进行半定松弛,然后将其转换为特征分解问题,并利用数据的稀疏性设计了改进的模型降阶方法进行求解,进一步提高了算法的计算速度。算法具有可伸缩性、计算成本低和精度高等优点。最后,在模拟和真实的位姿图数据集上进行实验评估,结果表明在不影响精度的情况下,该算法可以快速地进行位姿图优化。