您好, 访客   登录/注册

基于决策树算法的安徽省油菜产量气象限制因子分析及预测模型研究

来源:用户上传      作者:

  摘要:为分析气象因子对安徽省油菜(Brassica napus L.)产量的影响,构建适用于油菜单位面积产量预测模型,利用1999—2018年安徽省78个站点的地面气象观测资料及2000—2018年78个县(市、区)的油菜单位面积产量数据,采用决策树算法对影响油菜产量的气象因子进行分析,筛选因子基于支持向量机建立油菜产量预测模型。结果表明,影响油菜产量的主要气象因子是成熟期湿润指数、蕾薹期平均气温、苗期湿润指数、开花期湿润指数,预测模型的预测值与实测值的均方根误差为402 kg/hm2,拟合指数为0.72。
  关键词:油菜(Brassica napus L.);气象;决策树;支持向量机;預测
  中图分类号:S565.4 文献标识码:A
  文章编号:0439-8114(2020) 16-0158-03
  D0I:10.14088/j.cnki.issn0439-8114.2020.16.036
  油菜(Brassica napus L.)是安徽省种植面积最大的油料作物,2017年总产量占全国油菜总产的6%以上,位居全国第五位[1]。安徽省油菜的生育期约220 d,一般10月上中旬开始播种,翌年5月中旬收获。在油菜生长发育的进程中,受气象因子影响较大,连阴雨天气、低温冻害对其产量的影响尤为显著,且气温与光照在其不同生育期的影响作用存在差异[2-16]。油菜预测模型的研究已取得一定的成果,现有的机理性或半机理性模型有APSIM、EPIC、DSSAT、CROPGRO等,还有学者基于数理统计构建了油菜单产预测模型[17-20]。机理性模型使用时,需要输入的参数较多,数据获取不便,并且需对关键参数进行本地化调整,而当前构建的统计类模型,因不同地域对油菜单产造成影响的关键生育期及气象因子存在差异而无法直接使用[21,22],因此,对安徽省油菜不同生育期的气候条件对产量的影响深入研究,以便构建适用于预测模型,为探讨油菜经济效益、应对气象灾害风险管理提供参考。
  1资料与方法
  1.1资料来源
  油菜产量数据,来源于安徽省各市统计局,包含2000-2018年安徽78个县(市、区)的单位面积产量;气象数据来源于全国综合气象信息共享平台(CIMISS),包含1999-2018年安徽省78个国家级气象站的逐日平均气压、平均气温、平均相对湿度、平均风速、日照时数、降水量、最高气温、最低气温、经纬度等数据。
  1.2 计算方法
  将油菜产量分解为趋势产量、气象产量。趋势产量由农业技术水平决定,与时间相关,气象产量与各生育期的气温、日照、干旱、湿渍害、冻害相关。冻害指标选取参照秦鹏程等[23]研究选取冷积温,其计算公式如式(1)、式(2)。干旱、湿渍害指标的选取参照徐羽等[24]研究选取湿润指数,其计算公式见式⑶、式(4)。
  为便于分析将油菜生育期划分为4个阶段,每个阶段对应日期见表1,将产量划分为5个量级见表2。采用决策树算法对油菜量级与4个生育期冷积温平均气温(TEM)、平均日照时数(SSH)、冷积温(CDD)、湿润指数(W)进行划分,得出影响油菜产量的关键因子,将其作为自变量带入支持向量机算法,进行产量预测模型的构建。COD = ∑Ni DDi (1)DD={ O,Tmin≥Tthr Tthr-Tmin,Tmin
  式中,Tmin为日最低气温,Tthr为该生育期冻害指标,N表示该生育期持续日数;P为该生育期降水量,ET为日参考作物蒸散量,△表示饱和水汽压曲线斜率,R为参考作物表层净辐射,γ为干湿表常数,T为平均气温,u为2 m高度处风速,es为饱和水汽压,ea为实际水汽压。
  2结果与分析
  2.1决策树分类提取因子
  决策树是解决分类问题的一种常用方法,是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。采用C5.0决策树算法分析油菜产量与年份及各生育期气象因子之间的关系(总样本593个),结果如图1所示。根结点以年份≤2011为判定条件,在2011年之前产量较低,集中在I、II、III量级,延伸细分显示,产量随年份变化还存在2003年、2006年两个节点,2003年之前产量以量级I为主,占50%以上(47個样本),2004-2006年有所提高,量级I占20%左右(53个样本),2007-2011年以量级III为主,占比接近60% (130个样本);在2011年后成熟期湿渍害、蕾薹期气温、开花期的湿渍害、苗期的干湿条件对产量影响较大,当成熟期湿润指数>2.53时产量偏低,且当开花期湿润指数>2.09时产量进一步降低,其量级I、II占比接近60%(50个样本),产量最高出现在成熟期湿润指数≤2.53、蕾薹期平均气温>4.89℃、苗期湿润指数>0.99,其量级IV、V占比接近70%(186个样本)。
  2.2 支持向量机预测模型
  支持向量机方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折中,以获得最好的推广能力[25-27]。模型构建时将年份Year、成熟期湿润指数W4、蕾薹期平均气温TEM2、开花期湿润指数W3、苗期湿润指数W1作为输入因子,对油菜单位面积产量进行预测,采用K值交叉验证,将所有数据分割成10个子样本,不重复地选取其中一个子样本作为测试集,其他9个样本用来训练,模型评价指标采用均方根误差以及拟合指数IA,共重复10次,使每个子样本都参与训练且被测试,降低泛化误差。由图2可以看出,模型得出的预测值与实测值的均方根误差为402kg/hm2,拟合指数为0.72,具有一定的应用价值。
  3小结与讨论
  利用1999-2018年安徽省78个国家级气象站的地面气象观测资料及相应的油菜产量数据,基于决策树C5.0算法对影响油菜产量的气象因子进行分析,筛选出关键因子,并采用支持向量机算法构建安徽省油菜单位面积产量预测模型。   1)安徽地区油菜单位面积产量在时间尺度上存在3个增加节点,即2003年、2006年、2011年;
  2) 成熟期湿渍害、蕾薹期气温、开花期的湿渍害、苗期的干湿条件对单位面积产量影响较大,当成熟期湿润指数≤2.53、蕾薹期平均气温>4.89、苗期湿润指数> 0.99,单位面积产量最高;
  3) 所建立的油菜单位面积产量预测模型,得出的预测值与实测值的均方根误差为402 kg/hm2,拟合指数为0.72,具有一定的应用价值。
  本研究所用的油菜产量数据受抽样调查等统计方法的影响,存在一定偏差,数据时空跨度较大,但未考虑油菜品种对其的影响,模型构建所需数据样本不足,有待进一步加强。
  参考文献:
  [1 ]中华人民共和国国家统计局.中国统计年鉴-2012[M].北京:中国统计出版社,2012.
  [2]刘瑞娜,杨太明,陈金华,等.安徽省春季连阴雨分布特征及其对油菜产量影响评估[J].中国农学通报,2012, 28(34):252-256.
  [3] 陈晓艺,岳伟,王晓东,等.安徽省油菜主要发育期预报业务化模型研究[J].中国农学通报,2012, 28(3):75-80.
  [4]刘瑞娜,杨太明,王晓东,等.近50年安徽省油菜涝渍灾害时空变化分析[J].农学学报,2016, 6(1): 110-116.
  [5]陆魁东,彭莉莉,黄晚华,等.气候变化背景下湖南油菜气象灾害风险评估[J].中国农业气象,2013, 34(2):191-196.
  [6]曹宏鑫,张春雷,李光明,等.油菜生长发育模拟模型研究[J].作物学报,2006,32( 10): 1530-1536.
  [7] 黄淑娥,祝必琴,辜晓青,等.鄱阳湖地区油菜生产气象条件分析与种植气候区划[J].江西农业大学学报,2009,31 (5): 167-171.
  [8]陆魁东,彭莉莉,黄晚华,等.气候变化背景下湖南油菜气象灾害风险评估[J].中国农业气象,2013, 34(2):191-196.
  [9]王文军,童明达,唐继云.油菜产量的气象模拟分析[J].作物杂志,2010(3):38-41.
  [10] 梁轶,李星敏,周辉,等.陕西油菜生态气候适宜性分析与精细化区划[J].中国农业气象,2013,34(1 ):50-57.
  [11] 沈惠聪,江宇.甘蓝型油菜种子主要脂肪酸气象生态效应及数学[J].浙江农业大学学报,1990,16( 1) :69-76.
  [12] 董芹,霍焱,蒋骏,等.油菜生育期气象指数等级及灾害预警指标研究[J ].江苏农业科学,2015,43(10): 84-90.
  [13] 孙玉莲,边学军,黄成秀,等.甘肃临夏高寒区油菜种植气候区划与产量预测气候模型[J].干旱地区农业研究,2013,31(2):53-57.
  [14] 宋迎波,王建林,陈晖,等.中国油菜产量动态预报方法研究[J].气象,2008,34(3):95-101.
  [15] 方丽,李涵茂,戴鹏飞,等.湖南省油菜生育期間气候资源时空变化规律分析[J].气象科技,2014,42(4):725-730.
  [16] 郭翔,王明田,李金建,等.四川盆地区油菜农业气候适宜性分析与精细化区划[J].西南农业学报,2015,28(2):408-414.
  [17] 蔡承智,王芳,莫洪兰,等.基于ARIMA模型的我国油菜单产预测分析[J].中国农业资源与区划,2018,39( 1):71 -76.
  [18] 徐飞.灰色预测模型在我国油菜产量预测中的应用[J].安徽农业科学,2011,39(7):3854-3855.
  [19] 张晓云,孔祥萍,张海春.高寒地区油菜花期与气象条件的关系及预测模型[J].中国农学通报,2019,35(13):102-106.
  [20] 王占林,张海春.基于多元回归的高寒地区油菜产量预测模型[J].中国农学通报,2019,35(14):38-41.
  [21] 戴清明,吕爱钦,何维君,等.洞庭湖区油菜主要气象灾害发生规律与减灾避灾对策[J].作物研究,2006,20( 1): 37-42.
  [22]余兆海.气候条件对油菜产量的影响[J].中国农业科学,1981,14(5):64-70.
  [23] 秦鹏程,刘志雄,万素琴,等.基于决策树和随机森林模型的湖北油菜产量限制因子分析[J].中国农业气象,2016, 37(6):691-699.
  [24] 徐羽,徐刚,吴艳飞,等.重庆市参考作物蒸散量及湿润指数变化研究[J].水土保持研究,2015,22(3): 176-181.
  [25] 刘柏林.基于电网运行数据集的电力系统运行评估及优化研究[D].北京:华北电力大学,2017.
  [26]丁世飞,齐丙娟,谭红艳.支持向量机理论与算法研究综述[J].电子科技大学学报,2011( 1) :4-12.
  [27] 陶卿,曹进德,孙德敏.基于支持向量机分类的回归方法[J].软件学报,2002(5): 156-160.
  收稿日期:2019-12 -10
  基金项目:安徽省气象局硕博士工作启动经费项目(RC201620)
  作者简介:杨小兵(1990-),男,江苏兴化人,工程师,硕士,主要从事应用气象、数据分析与建模研究,(电话)15256941260(电子信箱)yangxb1990@163.com;通信作者,杨峻(1992-),男,江苏兴化人,硕士,主要从事计算机控制与优化研究,(电子信箱)seahiscuityj@163.com。
转载注明来源:https://www.xzbu.com/8/view-15352184.htm