分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-12-13 合作期刊: 《计算机应用研究》
摘要: 现有的中文自动文本摘要方法主要是利用文本自身的信息,其缺陷是不能充分利用词语之间的语义相关等信息。鉴于此,提出了一种改进的中文文本摘要方法。此方法将外部语料库的信息用词向量的形式融入到TextRank算法,通过TextRank与word2vec的结合,把句子中每个词语映射到高维词库形成句向量。充分考虑句子之间的相似度、关键词的覆盖率和句子与标题的相似度等因素,以此计算句子之间的影响权重,并选取排序最靠前的句子重新排序作为文本的摘要。在本文的数据集中取得了较好的效果。实验结果表明,此方法自动提取中文摘要的效果比原方法好。