• 学术社交网络问答质量智能评价与服务优化研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 学术社交网络所提供的问答服务已成为学者们快速获取学术信息、解决学术问题的重要途径,实现基于机器学习的问答质量智能评价和服务优化对学术社交网络中优质内容传播具有重要意义。[方法/过程] 以ResearchGate问答服务为研究对象,从结构化特征、内容特征、其他特征以及回答者特征4个维度构建答案质量评价体系,利用机器学习方法和数据增强技术进行答案质量分类预测。[结果/结论] SMOTE算法在处理不平衡样本时具备有效性;支持向量机在单一模型预测中,取得出色的分类效果;组合模型使预测精度得到进一步提升,基于随机森林、支持向量机、BP神经网络构建的组合模型分类性能最佳,以此为基础可通过搭建问答质量智能评价系统实现学术社交网络问答服务优化。

  • 基于多种机器学习算法预测广西蔗区甘蔗产量

    分类: 农、林、牧、渔 >> 农业基础学科 提交时间: 2023-08-14 合作期刊: 《智慧农业(中英文)》

    摘要: [目的/意义]分析广西甘蔗主产区甘蔗产量与气象因素的关系,利用气象数据预测甘蔗产量,为糖厂及 相关管理部门提供科学的数据支撑。[方法]选用2002~2019年广西五个不同地级市内蔗区的产量数据及14种逐 日气象数据,将每年的各气象因子以78个逐月递增的连续时段的均值与产量进行相关性分析,根据敏感时段分析 法确定关键气象因子,并分析各气象因子在敏感时段对产量的影响。分别利用BP神经网络(BP Neural Network, BPNN)、支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)、长短期记忆网络(Long Short-Term Memory,LSTM) 建立单蔗区产量预测模型,并采用以全生育期气象均值作为模型输入的方法进行对照 实验。使用HP 滤波法(Hodrick Prescott Filter) 分离出甘蔗气象产量,将5 个蔗区的数据混合,分别利用RF、 SVM、BPNN和LSTM建立通用的多蔗区气象产量预测模型。[结果和讨论]对于单蔗区,敏感时段分析法的模型 预测效果明显优于全生育期取气象均值的方法,LSTM模型对于上述两种数据处理方法的预测效果均明显优于目 前广泛使用的BPNN、SVM、RF模型,敏感时段分析法的LSTM模型整体的均方根误差(Root Mean Square Error, RMSE) 和平均绝对百分比误差(Mean Absolute Percentage Error,MAPE) 分别为10.34 t/ha和6.85%,决定系数Rv 2 为0.8489。对于多蔗区,LSTM预测结果较差,RF、SVM及BPNN三种预测模型都取得了良好的效果,预测效果最 好的BPNN模型的RMSE和MAPE分别为0.98 t/ha和9.59%,Rv 2为0.965。[结论]通过敏感时段分析法筛选的关键 气象因子与产量均呈显著相关,根据敏感时段能准确地分析各气象因子对产量的影响。使用LSTM模型预测单蔗 区产量,使用BPNN模型预测多蔗区甘蔗气象产量的方法是可行的,且预测误差在可接受范围内。