分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-11-29 合作期刊: 《计算机应用研究》
摘要: 近年来,越来越多的人从互联网上检索自己需要的信息。检索系统利用排名学习算法从训练集中产生一个排名模型。而检索数据需要的时间则是检索系统的一种重要研究方向。为了减少检索的时间,对排名模型的剪枝策略和缓存进行了研究。利用决策树的冗余特性和高速缓冲存储器,提出了剪枝决策树模型和分块算法。最后,在两个公开的数据集上进行了实验,主要关注了是否可以在不影响模型效果下,提高排名模型的效率的问题。实验结果表明剪枝决策树模型和分块算法可以有效地减少每个查询的排名时间。