ChinaXiv.org 中国科学院科技论文预发布平台

注册登录

EN | 中文

按提交时间

2018
1

按主题分类

计算机科学的集成理论
1

按作者

按机构

中国人民公安大学信息技术与网络安全学院
1

当前资源共 1条

隐藏摘要

点击量

时间

1. ChinaXiv:201811.00197
下载全文

基于深度学习的中文微博作者身份识别研究

分类：计算机科学 >> 计算机科学的集成理论提交时间： 2018-11-29 合作期刊: 《计算机应用研究》

徐晓霖蔡满春芦天亮

摘要：作者身份识别一直在公安行业和文检工作中起着重要的作用。现有的作者语言风格建模过程繁琐、文本特征工程没有普适性。针对此问题，在无须专家进行特征建模的情况下，提出CABLSTM中文微博作者身份识别模型，并在公开微博语料集测试该模型准确度。该模型为最大化的提取短文本特征，融合Attention机制于CNN中并去除池化层，通过双向LSTM以获取上下文相关信息，身份识别结果通过Softmax层进行输出。实验结果表明，该模型在进行中文微博作者身份识别任务中与传统机器学习算法以及TextCNN和LSTM算法相对比，在准确率、召回率、F值方面都有一定的提升。

点击量 1598 下载量 868 评论

友情链接: PubScholar 哲学社会科学预印本

运营单位: 中国科学院文献情报中心
制作维护：中国科学院文献情报中心知识系统部
邮箱: eprint@mail.las.ac.cn
地址：北京中关村北四环西路33号

招募预印本评审专家许可声明法律声明

京ICP备05002861号-25 | 京公网安备110402500046号
版权所有© 2016 中国科学院文献情报中心