分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2022-05-18 合作期刊: 《计算机应用研究》
摘要: 文本表示需要解决文本词语的歧义性问题,并能够准确界定词语在特定上下文语境中的语义特征。针对词语的多义性及语境特征问题,提出了一种文本语义消歧的SCDVAB模型。主要创新点有:基于分区平均技术,将场景语料库转换为文档嵌入,并引入各向异性,改进了软聚类的稀疏复合文档向量(SCDV)算法,以提高BERT的语境化表示能力;将调整各向异性后的BERT词语嵌入,作为静态词语向量的文档嵌入,以提升文本语义消歧的能力。通过大量实验进一步证明,SCDVAB模型的效果明显优于传统的文本消歧算法, SCDVAB模型可有效提高文本语义消歧的综合性能。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-12-05 合作期刊: 《数据分析与知识发现》
摘要: 【目的】构建网络信息内容可信度的定量测度模型, 以提高虚假信息的筛除效率。【方法】基于贝叶斯推 理理论, 构建网络信息内容可信度的测度模型; 基于贝叶斯决策理论, 构建可信度测度有效性的最小错误率评 估模型。【结果】基于实际数据集的实验结果表明, 随着社会化媒体参与者规模增加, 可信度测度的最小错误率 呈下降趋势, 且贝叶斯可信度测度模型总体优于传统的模糊可信度测度模型。【局限】可信度测度错误率的影响 因素只关注参与者规模因素, 而其他影响因素, 如条件属性或可参照对象等, 将需要进一步研究。【结论】基于 集体智慧理论, 揭示网络信息内容可信度测度的最小错误率会随着参与者规模增加而降低。