Current Location:home > Browse

1. chinaXiv:202108.00111 [pdf]

一种双流CNN的太阳黑子群磁类型分类方法

杨五谷; 田卫新; 曾曙光; 黄瑶
Subjects: Astronomy >> Astrophysical processes

太阳耀斑大多数发生在磁极复杂的黑子群上空,因此黑子群磁类型可作为预测太阳耀斑的重要依据。针对同时具有白光图和磁图数据的太阳黑子分类,提出了一种双流CNN的黑子群磁类型分类方法。该方法通过两个网络分支同时提取白光图和磁图特征,在全连接层对二类特征进行融合,最后用于训练和分类。实验表明该方法能较好避免单通道网络模型的信息损失以及使用双通道图像合成出现的白光图和磁图的相互影响,加权F1分数可达84.87%,平均准确率可达84.93%。

submitted time 2021-08-20 From cooperative journals:《天文研究与技术》 Hits962Downloads82 Comment 0

2. chinaXiv:202010.00061 [pdf]

基于span分类模型的医学概念抽取方法

汤勇韬; 余杰; 李莎莎; 纪斌; 谭郁松; 吴庆波
Subjects: Computer Science >> Natural Language Understanding and Machine Translation

最近,如何构造电子病历(EMR)引起了研究人员的极大关注。从EMR中提取临床概念是EMR结构化的关键部分。临床概念提取的性能将直接影响与EMR结构化相关的下游任务的性能。但是,主流方法中,序列标记模型有一些缺点。基于序列标记的临床概念提取方法不符合人类的语言认知模型。同时,这种方法产生的提取结果很难与下游任务耦合,这将导致错误传播并影响下游任务的性能。为了解决这些问题,我们提出了一种基于span分类的方法,通过考虑字符序列的整体语义而不是每个字符的语义来提高临床概念提取任务的性能。我们将此模型称为span分类模型。实验表明,span分类模型在2012年i2b2 NLP挑战赛的语料库中获得了最佳的微观平均F1得分(81.22%),并获得了与2010年i2b2 NLP挑战赛的SOTA相当的F1得分(89.25%)。此外,我们的方法的性能始终优于序列标记模型,例如BiLSTM-CRF模型和softmax分类器。

submitted time 2020-10-27 Hits10075Downloads1003 Comment 0

3. chinaXiv:201905.00047 [pdf]

Text-CRNN+Attention架构下的多类别文本信息分类

卢健; 马成贤; 杨腾飞; 周嫣然
Subjects: Computer Science >> Integration Theory of Computer Science

文本分类作为数据挖掘和信息检索领域的研究热点。迄今为止,传统机器学习方法依赖人工提取特征,复杂度高;深度学习网络本身特征表达能力强,但模型可解释性弱导致关键特征信息丢失。为此,以网络层次结合的方式设计了CRNN网络,并引入Attention机制,提出一种Text-CRNN+Attention模型。首先利用CNN处理局部特征的位置不变性,提取高效局部特征信息;然后RNN进行序列特征建模时,引入Attention机制对每一时刻输出序列信息进行自动加权,减少关键特征的丢失;最后完成时间和空间上的特征提取。实验结果表明,提出的模型较其他模型准确率提升了2~3个百分点;在提取文本特征时,该模型既保证了数据的局部相关性,又起到强化序列特征的有效组合能力。

submitted time 2019-05-10 From cooperative journals:《计算机应用研究》 Hits4933Downloads1223 Comment 0

4. chinaXiv:201902.00062 [pdf]

Multimedia Short Text Classification via Deep RNN-CNN Cascade

陶爱山
Subjects: Computer Science >> Natural Language Understanding and Machine Translation

Abstract—With the rapid development of mobile technologies, social networking softwares such as Twitter, Weibo and WeChat are becoming ubiquitous in our every day life. These social networks generate a deluge of data that consists of not only plain texts but also images, videos, and audios. As a consequence, the traditional approaches that classify the short text by counting only the key words become inadequate. In this paper, we propose a multimedia short text classification approach by deep RNN(Recurrent neural network ) and CNN(Convolutional neural network) cascade. We first employ an LSTM(Long short-term memory) net- work to convert the information in the images into text information. Then a convolutional neural network is used to classify the multimedia texts by taking into account both the texts generated from the image as well as those contained in the initial message. It is seen through experiments using MSCOCO dataset that the proposed method exhibits significant performance improvement over the traditional methods.

submitted time 2019-02-22 Hits7559Downloads933 Comment 0

5. chinaXiv:201811.00197 [pdf]

基于深度学习的中文微博作者身份识别研究

徐晓霖; 蔡满春; 芦天亮
Subjects: Computer Science >> Integration Theory of Computer Science

作者身份识别一直在公安行业和文检工作中起着重要的作用。现有的作者语言风格建模过程繁琐、文本特征工程没有普适性。针对此问题,在无须专家进行特征建模的情况下,提出CABLSTM中文微博作者身份识别模型,并在公开微博语料集测试该模型准确度。该模型为最大化的提取短文本特征,融合Attention机制于CNN中并去除池化层,通过双向LSTM以获取上下文相关信息,身份识别结果通过Softmax层进行输出。实验结果表明,该模型在进行中文微博作者身份识别任务中与传统机器学习算法以及TextCNN和LSTM算法相对比,在准确率、召回率、F值方面都有一定的提升。

submitted time 2018-11-29 From cooperative journals:《计算机应用研究》 Hits1028Downloads571 Comment 0

6. chinaXiv:201809.00065 [pdf]

基于DRN和FasterR-CNN融合模型的行为识别算法

杨楠; 杨莘; 杜能
Subjects: Computer Science >> Integration Theory of Computer Science

针对传统单人行为识别算法易受行人形态多样性、背景和光照等影响的问题进行了研究。基于扩张卷积残差网络DRN在分类效果及目标检测网络Faster R-CNN在目标追踪方面的准确性,提出了一种DRN和Faster R-CNN的融合网络模型。该模型在Faster R-CNN中融入DRN的扩张卷积残差块代替原来的一般卷积层部分。并对融合模型进行了两方面的改进:在每一层前面添加一个batch normalization层;用三层扩张卷积残差块代替部分两层残差块。实验结果表明三种融合网络识别算法在Olympic sports dataset数据库上较其他行为识别算法取得了更高的mAP。其中,包含三层扩张卷积残差块的融合模型识别性能最好,mAP达到78.9%。

submitted time 2018-09-12 From cooperative journals:《计算机应用研究》 Hits723Downloads483 Comment 0

7. chinaXiv:201808.00076 [pdf]

基于FasterR-CNN的服务机器人物品识别研究

石杰; 周亚丽; 张奇志
Subjects: Computer Science >> Integration Theory of Computer Science

随着机器人在服务行业中的应用推广,尤其在家庭服务中有着重要的作用,对服务机器人的信息采集或目标识别需求也越来越强烈。传统的日用商品识别流程通常使用较为经典的图像识别和机器学习算法,如支持向量机(SVM)、随机森林或Adaboost,然后利用目标图像的梯度、纹理或颜色的基本特征来对日用商品进行识别,可以在比较简单的背景中得到应用,但是在复杂的背景环境中很难有比较突出的表现,并且难以达到较高的准确率。目前在目标识别中表现比较优异的是卷积神经网络(CNN),并成为很多目标识别场景中的首选。考虑到服务机器人的硬件配置成本,将基于区域的卷积神经网络(R-CNN)的快速算法Faster R-CNN引入系统中,并以CPU计算的方式进行物品识别。利用CNN网络提取图像特征,在其后面接入一个区域提议层。实验结果表明,将深度学习的识别方法应用到服务机器人平台是可行的,识别效果准确,且在实验中得到较好的检测效果。

submitted time 2018-08-13 From cooperative journals:《计算机应用研究》 Hits1087Downloads687 Comment 0

8. chinaXiv:201806.00111 [pdf]

基于CNN-LSTM的QAR数据特征提取与预测

张鹏; 杨涛; 刘亚楠; 樊志勇; 段照斌
Subjects: Computer Science >> Integration Theory of Computer Science

针对传统数据驱动的故障诊断方法难以从QAR数据中提取有效特征的问题,提出一种融合卷积神经网络(convolutional neural network,CNN)与长短时记忆网络(long short-term memory,LSTM)的双通道融合模型CNN-LSTM。CNN与LSTM分别作为两个通道,通过注意力机制(attention)融合,从而使模型能同时表达数据在空间维度和时间维度上的特征,并以时间序列预测的方式验证融合模型特征提取的有效性。实验结果表明,双通道融合模型与单一的CNN、LSTM相比,能够更有效地提取数据特征,模型单步预测与多步预测误差平均降低35.3%。为基于QAR数据的故障诊断提供一种新的研究思路。

submitted time 2018-06-19 From cooperative journals:《计算机应用研究》 Hits2064Downloads1436 Comment 0

  [1 Pages/ 8 Totals]