• 基于堆稀疏自编码的二叉树集成入侵检测方法

    分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2019-04-01 合作期刊: 《计算机应用研究》

    摘要: 至今已经有许多不同的机器学习方法被提出来,而传统的机器学习方法无法有效解决大规模入侵数据的分类问题,为了解决大规模入侵数据的分类问题,提出的堆稀疏自编码的lightGBM(light gridient boosting model)二叉树算法。首先将类别标签分为五类,构造成二叉树结构,然后通过上采样方法解决数据分布的不平衡问题,以上处理可以将大规模的数据分解开来以便之后分开训练,再采用稀疏自编码器网络进行特征降维,采用该种降维方法可以保证在原始数据中抽取出更深层特征的基础上节省降维时间。最后通过lightGBM集成算法进行分类,而采用lightGBM模型相比其他模型可以在保证分类性能的情况下节省训练时间。实验利用NSL-KDD数据集测量了所提方法的准确率(accuracy)、精确率(precision)、召回率(recall)以及综合评价指标F1在五类分类上平均分别达到了87.42%,98.20%,91.31%,优于对比算法,且明显节省了运算时间。