分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-06-06 合作期刊: 《计算机应用研究》
摘要: 针对大数据环境下并行深度卷积神经网络(DCNN)算法中存在数据冗余特征多、卷积层运算速度慢、损失函数收敛性差等问题,提出了一种基于Im2col 方法的并行深度卷积神经网络优化算法IA-PDCNNOA。首先,提出基于Marr-Hildreth算子的并行特征提取策略MHO-PFES,提取数据中的目标特征作为卷积神经网络的输入,有效避免数据冗余特征多的问题;其次,设计基于Im2col方法的并行模型训练策略IM-PMTS,通过设计马氏距离中心值去除冗余卷积核,并结合MapReduce和Im2col方法并行训练模型,提高了卷积层运算速度;最后,提出改进的小批量梯度下降策略IM-BGDS,排除异常节点的训练数据对批梯度的影响,解决了损失函数收敛性差的问题。实验结果表明,IA- PDCNNOA算法在大数据环境下进行深度卷积神经网络计算具有较好的性能表现,适用于大规模数据集的并行化深度卷积神经网络模型训练。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-05-11 合作期刊: 《计算机应用研究》
摘要: 针对Raft算法无法抵抗拜占庭节点的攻击和日志易篡改窜改等问题,设计了一种抵抗拜占庭节点的RB-Raft(Resist Byzantine-Raft)算法。首先采用哈希链的方式对每一块日志进行迭代哈希处理,通过动态验证机制对日志进行验证使得对Leader节点的恶意行为具有一定的容错率,解决了日志伪造与验证的问题。其次,提出基于门限加密的“遗书”机制,使得Candidate节点拉取选票具有合法性,防止拜占庭节点随意拉取选票更换Leader节点的攻击,解决了拜占庭节点影响系统一致性的问题。实验结果表明,本文提出的RB-Raft算法具有抗拜占庭节点的能力,其日志识别率可以达到100%。同时,相比PBFT,本文算法共识时延降低了53.3%,并且吞吐量提高了61.8%。本文提出的算法适用于在不可信联盟链中进行共识。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-04-07 合作期刊: 《计算机应用研究》
摘要: 针对经典花授粉算法容易陷入局部最优解和收敛速度慢的缺点,提出一种增强型透镜成像策略和随机邻域变异策略的花授粉算法。通过增强型透镜成像策略扩展花授粉算法的搜索空间,增加解的多样性有助于算法跳出局部最优解。引入随机邻域变异策略,借助邻域内的信息指导算法搜索,增强算法的收敛精度和搜索速度。并且对改进后的花授粉算法和4种其他改进算法在CEC2013测试函数上比较,实验证明改进后的多策略花授粉算法不管是在收敛精度还是搜索速度都比对比算法优秀。最后把多策略花授粉算法应用在汽车传动参数模型上研究该算法的实际效用,结果表明多策略花授粉算法在汽车传动参数优化问题上都优于对比算法。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2020-09-28 合作期刊: 《计算机应用研究》
摘要: 针对并行MRPrePost (parallel PrePost algorithm based on MapReduce)频繁项集挖掘算法在大数据环境存在运行时间长,内存占用量大和节点负载不均衡的问题。提出一种基于DiffNodeset的并行频繁项集挖掘算法—PFIMD(parallel frequent itemsets mining using DiffNodeset)。该算法首先采用一种数据结构DiffNodeset,有效的避免了N-list基数过大的问题;此外提出一种双向比较策略“T-wcs”(2-way comparison strategy),以减少两个DiffNodeset在连接过程中的无效计算,极大的降低了算法时间复杂度;最后考虑到集群负载对并行算法效率的影响,进一步提出了一种基于动态分组的负载均衡策略“LBSBDG”(load balancing strategy based on dynamic grouping),该策略通过将频繁1项集F-list中的每项进行均匀分组,降低了集群中每个计算节点上PPC-Tree树的规模,进而减少了先序后序遍历PPC-Tree树所需的时间。实验结果表明,该算法在大数据环境下进行频繁项集挖掘具有较好的效果。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2019-05-10 合作期刊: 《计算机应用研究》
摘要: 针对大数据聚类低效的问题,提出一种方形邻域快速网格密度聚类算法SGBSCAN (square-neighborhood and Grid-based DBSCAN)。首先给出方形邻域密度聚类定义,利用方形邻域代替圆形邻域,降低时间复杂度;其次提出方形邻域密度聚类的Grid概念,快速确定高密度区域内核心点与数据点之间的密度关系;最后提出Grid密度簇,利用网格之间的关系加快密度簇的形成。算法应用于16个数据集,分别与已有文献算法进行对比,结果表明所提算法在聚类效率方面有显著提升,数据量越大算法效率提升越明显,且所提算法适用于多维数据的聚类。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2019-04-01 合作期刊: 《计算机应用研究》
摘要: 针对蚁群融合模糊C-means (FCM)聚类算法在蛋白质相互作用网络中进行复合物识别的准确率不高、召回率较低以及时间性能不佳等问题进行了研究,提出一种基于模糊蚁群的加权蛋白质复合物识别算法FAC-PC (algorithm for identifying weighted protein complexes based on fuzzy ant colony clustering)。首先,融合边聚集系数与基因共表达的皮尔逊相关系数构建加权网络;其次提出EPS (essential protein selection)度量公式来选取关键蛋白质,遍历关键蛋白质的邻居节点,设计蛋白质适应度PFC (protein fitness calculation)来获取关键组蛋白质,利用关键组蛋白质替换种子节点进行蚁群聚类,克服蚁群算法中因大量拾起放下和重复合并过滤操作而导致准确率和收敛速度过慢的缺陷;接着设计相似度SI (similarity improvement)度量优化拾起放下概率来对节点进行蚁群聚类进而获得聚类数目;最后将关键蛋白质和通过蚁群聚类得到的聚类数目初始化FCM算法,设计隶属度更新策略来优化隶属度的更新,同时提出兼顾类内距和类间距的FCM迭代目标函数,最终利用改进的FCM完成复合物的识别。将FAC-PC算法应用在DIP数据上进行复合物的识别,实验结果表明FAC-PC算法的准确率和召回率较高,能够较准确地识别蛋白质复合物。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2019-01-03 合作期刊: 《计算机应用研究》
摘要: 推荐系统需要利用到大量的用户行为数据,这些数据极有可能暴露用户的喜好,给人们关心的隐私问题带来了巨大的挑战。为保证推荐精度与用户隐私,提出一种结合差分隐私与标签信息的矩阵分解推荐模型。该模型首先将标签信息加入到项目相似度的计算过程,随后融入到矩阵分解推荐模型中提高推荐精度,最后运用随机梯度下降法求解模型最优值。为解决用户隐私问题,将拉普拉斯噪声划分成两部分,分别加入项目相似度与梯度求解过程中,使得整个推荐过程满足ε-差分隐私,并在一个真实的数据集上分析验证算法的有效性。实验表明,提出的方法能在保证用户隐私的情况下,仍具有较高的推荐精度。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2019-01-03 合作期刊: 《计算机应用研究》
摘要: 针对传统的协同过滤算法存在用户评分矩阵稀疏及未考虑项目属性之间关系的问题,提出了结合评分比例因子及项目属性的协同过滤算法。首先利用评分矩阵得出项目之间的共同与非共同评分用户数量比矩阵,以此增加项目共同评分用户的影响度,减少用户—项目评分矩阵的稀疏性对项目相似度计算带来的误差;然后对项目属性量化得出其对项目相似度的影响权重,提高项目相似度计算的准确性,根据以上两点提出了一种结合评分比例因子及项目属性权重作为项目相似度权重的算法。实验结果表明该算法在召回率和准确率上相比现有的方法分别提高了5.1%和4.7%,算法适用于电商类网站的个性化推荐。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-12-13 合作期刊: 《计算机应用研究》
摘要: 针对基于蚁群聚类的蛋白质复合物挖掘算法中,静态PPI网络难以真实反映细胞的动态特性,收敛速度较慢、聚类准确性和召回率不高等问题进行了研究,提出一种基于模糊粒度和紧密度的蚁群聚类的动态加权PPI网络复合物挖掘方法(joint fuzzy granular and closeness degree ant colony clustering-DPC,FGCDACC-DPC)。首先基于动态PPI网络的拓扑特性和生物特性设计了综合性权值度量(comprehensive weight metric,CWM),准确描述了蛋白质之间的相互作用;其次根据复合物的基本特征,构建一组稠密且高度共表达的复合核,然后设计模糊粒度和紧密度的拾起放下模型对其余节点聚类,降低了计算复杂度和随机性,加快聚类速度;最后基于功能信息传递和时序功能相关的思想分别构建了局部和全局权值更新策略,实现不同代蚁群和不同时刻网络之间的功能信息传递,提高聚类准确性。将FGCDACC-DPC算法应用在DIP数据上进行复合物挖掘,实验结果表明该算法的精度和召回率较高,能够较准确地识别蛋白质复合物。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-08-13 合作期刊: 《计算机应用研究》
摘要: Android应用普遍具有比所属类型更多的功能,需要获取更多的权限,过多的权限可能带来一定的安全隐患。针对这类问题,提出一种基于元信息的Android恶意软件检测方法。首先,通过对Android应用程序描述进行LDA主题提取,实现数据降维,使用K-means聚类算法按照功能类型对应用程序分组;然后,对属于同一功能类型的所有应用程序,提取其权限信息,以权限特征为研究对象,使用kNN算法进行Android恶意软件的分类检测。实验结果获得94.81%的平均准确率,证明方法的有效性和高准确率。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-05-20 合作期刊: 《计算机应用研究》
摘要: 针对滑坡危险性预测中降雨等不确定因素不能有效刻画及处理和现有的OPTICS-PLUS聚类算法需要设置密度阈值、时间复杂度高等问题进行了研究,为了提高滑坡危险性预测准确率,提出一种不确定NNSB-OPTICS聚类算法并应用于滑坡预测中。首先对OPTICS-PLUS算法扩张策略进行优化,避免了人工设置密度阈值,提高了算法效率;然后根据降雨量数据的分布特征,综合EW型距离公式和云模型理论,提出EC型距离公式,有效处理不确定数据降雨量;最后将不确定NNSB-OPTICS聚类算法应用于延安市宝塔区滑坡危险性预测中,建立滑坡危险性预测模型,滑坡预测精度达到89.7%。实验结果表明,该方法能够有效提高滑坡危险性预测精度,具有较高可行性。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-05-20 合作期刊: 《计算机应用研究》
摘要: 针对目前基于灰度共生矩阵相关水印算法存在容量较小的问题,提出一种将纹理复杂度和DCT域JND模型相结合的图像水印算法。首先将原图像分成子块,利用各子块灰度共生矩阵的四个纹理特性计算其纹理复杂度,并据此对子块进行排序以确定水印嵌入的子块位置后对原图像素矩阵进行DCT变换,结合新的分区方式计算各块JND值,根据JND值以及新的嵌入规则确定子块内水印嵌入方式。算法有效考虑了图像块的纹理特性和人眼视觉敏感性,加强了嵌入水印后的图像质量,提高了水印嵌入容量。实验结果表明,所提方法在嵌入相同容量的水印时,图像平均峰值信噪比(PSNR)较现有方法高出4.27%左右,在嵌入超过原方法容量上限一倍的水印时,图像平均PSNR仍有53.449 8 dB。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-04-19 合作期刊: 《计算机应用研究》
摘要: 针对滑坡预测聚类研究中由于难以确定传统聚类算法需要预先设置的簇个数和无法精准衡量不确定因素降雨量导致预测效果欠佳的问题,提出一种新的聚类算法—不确定PAHT(partition algorithm on the hierarchical thinking)算法,该算法引入一种不确定数据模型——M-D距离,其有效刻画了不确定的雨量数据;并结合层次聚类思想,通过找出最佳阙值p*自动确定k值。以延安宝塔区为实例进行对比实验,实验结果验证了不确定M-D距离和PAHT算法的有效性及不确定PAHT算法在滑坡危险性预测上的可行性。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-04-19 合作期刊: 《计算机应用研究》
摘要: 传统粒子群优化算法(PSO)对社会认知部分与自我认知部分都采用恒定学习常数,一定程度上限制种群全局协调能力。在算法收敛后期种群多样性丧失而导致全部个体收敛于搜索空间中的某一点,这易诱发早熟现象。针对这种缺陷提出一种动态学习混沌映射的粒子群优化算法(VLCMPSO)。在算法初期迭代中应多考虑自身记录的最佳点,在算法后期应快速向种群最佳点收敛,因而设计一种进行协调的动态学习因子。为克服早熟现象,判断种群多样性方差低于设定阈值时,以混沌映射的方式将该代最优个体位置更新且以新的方式进行优化操作。经实验证明新算法在收敛速度与精度上都具有更好的性能。