• 基于多种机器学习算法预测广西蔗区甘蔗产量

    分类: 农、林、牧、渔 >> 农业基础学科 提交时间: 2023-08-14 合作期刊: 《智慧农业(中英文)》

    摘要: [目的/意义]分析广西甘蔗主产区甘蔗产量与气象因素的关系,利用气象数据预测甘蔗产量,为糖厂及 相关管理部门提供科学的数据支撑。[方法]选用2002~2019年广西五个不同地级市内蔗区的产量数据及14种逐 日气象数据,将每年的各气象因子以78个逐月递增的连续时段的均值与产量进行相关性分析,根据敏感时段分析 法确定关键气象因子,并分析各气象因子在敏感时段对产量的影响。分别利用BP神经网络(BP Neural Network, BPNN)、支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)、长短期记忆网络(Long Short-Term Memory,LSTM) 建立单蔗区产量预测模型,并采用以全生育期气象均值作为模型输入的方法进行对照 实验。使用HP 滤波法(Hodrick Prescott Filter) 分离出甘蔗气象产量,将5 个蔗区的数据混合,分别利用RF、 SVM、BPNN和LSTM建立通用的多蔗区气象产量预测模型。[结果和讨论]对于单蔗区,敏感时段分析法的模型 预测效果明显优于全生育期取气象均值的方法,LSTM模型对于上述两种数据处理方法的预测效果均明显优于目 前广泛使用的BPNN、SVM、RF模型,敏感时段分析法的LSTM模型整体的均方根误差(Root Mean Square Error, RMSE) 和平均绝对百分比误差(Mean Absolute Percentage Error,MAPE) 分别为10.34 t/ha和6.85%,决定系数Rv 2 为0.8489。对于多蔗区,LSTM预测结果较差,RF、SVM及BPNN三种预测模型都取得了良好的效果,预测效果最 好的BPNN模型的RMSE和MAPE分别为0.98 t/ha和9.59%,Rv 2为0.965。[结论]通过敏感时段分析法筛选的关键 气象因子与产量均呈显著相关,根据敏感时段能准确地分析各气象因子对产量的影响。使用LSTM模型预测单蔗 区产量,使用BPNN模型预测多蔗区甘蔗气象产量的方法是可行的,且预测误差在可接受范围内。