您选择的条件: 李昕然
  • 基于图数据库Neo4j的学者合作图谱分析——以数字人文领域为例

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-10-08 合作期刊: 《知识管理论坛》

    摘要: [目的/意义]在深度数字化发展的背景下,数字人文成为跨学科深度融合的发展领域,学者之间的科研合作日益频繁,需要对其日趋复杂的合作关系进行分析与挖掘,帮助学者获得潜在的合作机会以促进学术交流。[方法/过程]将学者、机构、关键词作为节点数据,合著、被引、任职、研究主题作为关系数据,构建学者合作图谱,基于图数据库Neo4j进行存储,并利用Cypher查询语言和GDS算法库对数字人文领域学者的合作社区发现、核心学者识别、合作趋势预测进行分析。[结果/结论]实验结果证明,Neo4j数据库较好地实现了数字人文领域学者合作网络的构建和图谱分析,能够帮助学者们在众多研究者当中快速地寻找与自己研究兴趣和方向高度关联的跨学科学者,从而促进数字人文领域学者合作与学科发展。

  • 基于序列比对算法的中文文本相似度计算研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 针对序列比对算法在文本相似度中的应用,改进全局比对算法并提高该算法的准确性,同时,应用局部比对算法有效解决内容差异或长短差异较大的两文本进行比对的问题。[方法/过程] 首先,利用HanLP中的CRF模型对在线学术资源中文文本数据集进行规范化处理,构成中文序列集;然后,使用最新的中文维基百科语料训练Word2Vec模型来构建语词对打分矩阵;最后,基于打分矩阵和改进的打分规则,对进行全局比对/局部比对的两中文序列进行比对并获得比对的最优解,回溯该最优解,获取最优解的比对路径,计算两中文序列的相似度。[结果/结论] 实验结果表明,相较于目前全局比对算法的相关研究,本文基于词性标注的结果与Word2Vec构建的语词对打分矩阵进一步提升了全局比对算法计算文本相似度的准确性,同时,应用于文本相似度计算的局部比对算法能够有效解决内容差异或长短差异较大的两文本进行比对的问题。