您选择的条件: 王洪伟
  • 面向在线评论的比较观点挖掘研究综述

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】对比较观点挖掘和相关研究的主流研究方法和步骤进行综述, 为相关领域的未来研究提供指导。【文献范围】从WoS, Google Scholar, CNKI 中以“比较观点(Comparative Opinion)”、“比较句识别(Comparative Sentence)”、“比较关系(Comparative Relation)”等为检索词筛选获得55 篇相关文献。【方法】基于文献调研, 介绍比较范畴的划分、比较句识别、比较关系抽取和比较观点情感分析等研究进展。【结果】由于有限的序列规则, 比较观点的识别难以进一步提高, 对隐形比较观点的识别研究鲜有提及, 并且现有的抽取技术难以很好地提取比较要素。此外, 比较观点缺乏细粒度的情感分析。【局限】缺乏对现有比较观点识别方法的对比分析。【结论】本文提出的研究框架可以为未来进一步研究提供参考。此外, 未来的工作重点应关注通过比较观点识别追踪潜在竞争对手, 分析产品竞争力, 以及提供不同商品的对比分析等。

  • 基于文本内容特征选择的评论质量检测

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-10-11 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】在有效提取多维特征基础上, 考察评论内容特征对评论质量检测的影响。【方法】基于评论文本的信息特征度量和情感倾向的混合性, 量化并抽取评论内容特征, 采用GBDT 模型评估特征集合分类效果, 结合贪婪式特征选择算法识别有效内容特征, 分析其对评论质量检测的影响。【结果】将评论内容特征应用于评论质量检测任务中能取得较好的效果, 明显提升了实验准确率和召回率。【局限】实验对象主要是搜索型产品的评论数据, 未对其他享受型产品(如电影、音乐)等进行验证和比较。【结论】评论内容的信息增益、产品特征词的信息增益、评论客观情感倾向度、内容差异性对评论质量检测有明显作用。

  • 中文评论产品特征与观点抽取方法研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-10-11 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】针对中文在线评论产品特征与观点抽取问题, 提出一种基于置信度排序模型的抽取方法。【方法】在改进HITS 算法基础上, 综合考虑候选特征观点词的关联关系和语义关系构建置信度排序模型, 提取并过滤特征观点词。【结果】和基准模型相比, 本文方法对中文语料的产品特征和观点抽取能达到较高准确率和召回率。【局限】仅针对产品显性特征抽取, 没有考虑隐性特征的识别与抽取。【结论】利用特征词和观点词的双向增强关系和语义关系, 可以有效抽取产品特征观点; 情感极性过滤对提升观点词抽取准确率有较大作用。