分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-05-10 合作期刊: 《计算机应用研究》
摘要: 行为识别(Action Recognition,AR)是计算机视觉领域的研究热点,在安防监控、自动驾驶、生产安全等领域具有广泛的应用前景。首先,对行为识别的内涵与外延进行了剖析,提出了面临的技术挑战问题;其次,从时间特征提取、高效率优化和长期特征捕获三个角度分析比较了行为识别的工作原理;再次,对近十年43种基准AR方法在UCF101、HMDB51、Something-Something和Kinetics400数据集上的性能表征进行比对,有助于针对不同应用场景选择适合的AR模型;最后,指明了行为识别领域的未来发展方向,研究成果可为视频特征提取和视觉内容理解提供理论参考和技术支撑。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-05-10 合作期刊: 《计算机应用研究》
摘要: 近年来,深度有监督哈希检索方法已成功应用于众多图像检索系统中。但现有方法仍然存在一些不足:一是大部分深度哈希学习方法都采用对称策略来训练网络,但该策略训练通常比较耗时,难以用于大规模哈希学习过程;二是哈希学习过程中存在离散优化问题,现有方法将该问题进行松弛,但难以保证得到最优解。为解决上述问题,提出了一种贪心非对称深度有监督哈希图像检索方法,该方法将贪心算法和非对称策略的优势充分结合,进一步提高了哈希检索性能。本文在两个常用数据集上与17种先进方法进行比较。在CIFAR-10数据集上48比特条件下,与性能最好的方法相比mAP提高1.3%;在NUS-WIDE数据集上所有比特下,mAP平均提高2.3%。在两个数据集上的实验结果表明,本文方法可以进一步提高哈希检索性能。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-11-29 合作期刊: 《计算机应用研究》
摘要: 为提高在多真值场景下真值发现的准确性,提出一种多蚁群同步优化的多真值发现算法(multi-ant colonies synchronization optimization based multi-truth discovery algorithm,MAC-SO-MTD)。以最大化各数据源提供的观测值集合与该对象真值集合之间相似度的加权和为目标,将多真值发现问题建模为求解子集问题,在此基础上设计蚁群算法进行求解:根据对象个数设置相应的蚁群,构造子集问题的有向图,利用路径概率转移公式进行同步搜索真值;将信息素更新分为本次迭代最优更新和本次迭代不更新,提高了算法的收敛速度。最后,通过算法复杂度分析和在真实数据集上的实验验证了该算法的优越性。