环境科学  2021, Vol. 42 Issue (5): 2223-2231   PDF    
太湖水体Chl-a预测模型ARIMA的构建及应用优化
李娜1,2, 李勇1,2, 冯家成2, 单雅洁2, 钱佳宁2     
1. 河海大学浅水湖泊综合治理与资源开发教育部重点实验室, 南京 210098;
2. 河海大学环境学院, 南京 210098
摘要: 叶绿素a(Chl-a)是湖泊浮游植物生物量的重要指标,其含量能反映水中浮游植物的丰度和变化规律.以1999年12月~2019年8月太湖水体Chl-a和环境因子的逐月监测数据为基础,运用主成分分析方法探讨了Chl-a与环境因子的关系,据此建立了Chl-a与主要环境因素之间的多元线性逐步回归模型及自回归综合移动平均模型(ARIMA).结果表明:①太湖Chl-a浓度存在着明显的季节变化,且总体处于上升趋势.总磷(TP)、高锰酸盐指数、月均气温(MAT)和月度降雨量(MR)与Chl-a浓度存在较好的变化同步性,总氮(TN)和氨氮(NH4+-N)则表现出明显的滞后性.②主成分分析结果表明,太湖水体藻类暴发条件不仅仅是基于N和P等限制性因素,而是发展为TN、NH4+-N、TP和高锰酸盐指数、MR和MAT等多元因素的综合影响.③两种模型经验证比较,基于1999~2019年逐月资料建立的Chl-a浓度的ARIMA模型模拟效果和预测精度明显优于所建立的多元线性逐步回归模型,特别是在考虑主要环境因素作为自变量及优化自变量取值情况下其预测效果得到进一步提升.建立的ARIMA(0,1,1)(0,1,1)模型将有助于太湖藻类暴发的预报和预警,并为及时有效地安排水资源调度及调控等水环境管理措施提供依据.
关键词: 太湖      叶绿素a      环境因子      多元线性逐步回归      ARIMA模型     
Construction and Application Optimization of the Chl-a Forecast Model ARIMA for Lake Taihu
LI Na1,2 , LI Yong1,2 , FENG Jia-cheng2 , SHAN Ya-jie2 , QIAN Jia-ning2     
1. Key Laboratory of Integrated Regulation and Resources Development on Shallow Lakes, Ministry of Education, Hohai University, Nanjing 210098, China;
2. College of Environment, Hohai University, Nanjing 210098, China
Abstract: As an important indicator of phytoplankton biomass in lakes, the chlorophyll-a (Chl-a) concentration reflects the abundance and variation of phytoplankton in the water. Based on the monthly monitoring data of Chl-a and environmental factors in Lake Taihu from December 1999 to August 2019, key environmental factors related to Chl-a and their relationships were found using the principal component analysis (PCA) method. A multiple linear stepwise regression model and an auto-regressive integrated moving average (ARIMA) model were developed to predict the monthly Chl-a concentrations. The results showed that the Chl-a concentrations in Lake Taihu exhibited clear seasonal change characteristics and an overall trend of a gradual increase. The changes in total phosphorus (TP), the permanganate index, monthly average temperature (MAT), and monthly rainfall (MR) matched the Chl-a concentrations relatively well, whereas the changes in total nitrogen (TN) and ammonium nitrogen (NH4+-N) lagged significantly. The PCA results showed that the increased phytoplankton biomass and consequent algae outbreaks in Lake Taihu were not limited to the effect of a single factor such as TN or TP, but were comprehensively affected by multiple factors such as TN, NH4+-N, TP, the permanganate index, MR, and MAT. Through further validation, the ARIMA model of Chl-a concentrations was proved to be significantly better than the multiple linear stepwise regression model, especially when considering the key environmental factors as independent variables and optimizing their values. The established ARIMA (0, 1, 1) (0, 1, 1) model would be helpful for forecasting algae blooms in Lake Taihu and provide useful suggestions for water environmental management, such as water resources dispatch and regulation.
Key words: Lake Taihu      chlorophyll-a      environmental factors      multiple linear stepwise regression model      ARIMA model     

自20世纪60年代以来, 富营养化一直是湖泊和水库等水体生态环境质量的主要威胁之一.富营养化会加速浮游植物的繁殖, 进而导致水体溶解氧下降和水体生态环境质量恶化[1].水体中叶绿素a(Chl-a)浓度是指示湖泊富营养化程度和表征浮游植物生物量的重要指标[2, 3], 与水体中其他环境因子之间存在密切的响应关系, 其变化特征对藻类暴发的预报预警具有重要指示意义.

湖泊等水体中Chl-a及其环境因子的相关性研究已有大量报道, 其中理化因子(光照、水温、水动力、水深、风速、营养盐)、生物因子(牧食压力)和区域因子(水体面积、土地利用)等对Chl-a变化具有直接或间接的重大影响[4~8].Wu等[9]针对鄱阳湖藻类时空变化进行分析, 得出水下光照强度和透明度是限制Chl-a浓度的主要因素; Chen等[4]通过室内模拟以及太湖野外实验证明水温与磷能够改变Chl-a浓度; Mayora等[5]对中古巴拉那河理化因子的研究得出水位、水深以及电导率对Chl-a浓度变化具有很好的解释性.然而, 因地域水文气象等环境差异, 不同水体中Chl-a与环境因子的相关关系不尽相似, 针对性分析湖泊水体生态环境质量演变特征并构建基于其历史发展规律的Chl-a预测预报模型将更具实际指导意义.

时间序列方法是通过考察序列当前值与过去值以及随机因素的关系来建立具有一定精度的预测模型[10, 11], 综合考虑了所研究对象的历史发展变化规律和当前赋予变化, 在各个领域得到了广泛的应用和发展.其中自回归综合移动平均(ARIMA)模型[12]基于随机过程理论, 具有数据需求少, 结构简单, 建模速度快, 可以处理非平稳时间序列[13]的特点, 在水环境领域得到了广泛的应用.龚邵琦等[14]应用时间序列分析方法模拟了太湖Chl-a的变化并预测出各区2005年Chl-a的浓度, 一定程度上反映了太湖各区域Chl-a浓度的总体变化.尹义星等[15]将时间序列分析方法应用到太湖的未来特征水位的预测, 预测结果与实际情况较吻合.ARIMA模型是一种考虑环境变量对时间序列因素的响应关系的多元时间序列回归模型, 而湖泊水体中Chl-a的变化不仅具有季节性特征, 同时受到水体营养盐、水文气象等环境因素变化的综合影响而具有明显的非平稳特征.

太湖是我国第二大淡水湖泊, 近年来, 随着流域内工农业发展和人类活动强度增加, 太湖水体营养盐浓度不断上升, 造成了日益严重的富营养化问题及藻华频繁暴发现象.本文针对太湖Chl-a的变化特点, 分析20年来太湖水体月度Chl-a、营养盐水平和水文气象因素, 采用主成分分析法确定Chl-a的关联响应环境变量, 构建了基于主要环境变量的Chl-a多元线性逐步回归模型和动态变化的数学模拟模型ARIMA, 并通过比较分析考虑自变量和自变量取值方法等验证讨论其预测效果, 以期为有效预报预警太湖藻类暴发提供科学依据.

1 材料与方法 1.1 数据来源和预处理

太湖(30°56′~31°33′N, 119°54′~120°36′E)是我国第二大淡水湖泊, 地处长三角经济发达区[16], 平均水深1.89 m, 水面面积2 338 km2, 具有径流面积大、水面广和水深小的特点, 自1980年代以来一直遭受严重的富营养化和藻华.本研究选用的是太湖1999年1月~2019年8月的33个站点的逐月水质数据, 主要包括高锰酸盐指数、NH4+-N、TP、TN、Chl-a浓度及月均气温和月降雨量, 水质指标的分析测定均采用国家标准方法(太湖健康报告).根据湖区位置把33个站点分为9大湖区:梅梁湖、竺山湖、贡湖、东太湖、湖心区、西部沿岸区、东部沿岸区、南部沿岸区和五里湖(图 1).按照加权平均的方法计算出9大湖区的水质指标值, 然后根据面积平均算法计算太湖各指标平均值, 每个指标共237个样本数据.

图 1 太湖逐月水质采样点位分布示意 Fig. 1 Distribution of monthly water quality sampling sites in Lake Taihu

1.2 多元线性逐步回归

回归分析建立了因变量和自变量之间的数学关系表达式.当自变量的值确定时, 关系表达式可用于进行因变量预测.回归包括线性回归、非线性回归、单变量回归和多元回归.多元线性回归方程的一般形式为:

(1)

式中, β0, β1, …, βm是不确定的参数, ε是随机变量, 它表示除x之外的其他随机因素对y的总影响.

在实际应用中, 因变量y与自变量x1, x2, …, xm之间的关系是未知的.通过将方程与观测数据拟合, 可以估算结构(选定的独立变量xi)和相应的参数(βi).确定回归方程后, 对回归方程进行统计检验, 例如回归方程的显着性检验, 回归系数的显着性检验和残差分析[17].

1.3 ARIMA模型的构建 1.3.1 数据的平稳化

ARIMA模型中允许序列中含有趋势变动、季节变动和随机变动等综合因素的影响.如数据为非平稳序列, 对序列进行适当的差分以实现平稳性和正常性.由太湖1999年12月至2019年6月各月Chl-a时间序列图(图 2), 可以看出Chl-a存在季节性周期波动, 并呈总体上升趋势; 对原序列进行一阶差分和一阶季节性差分后, 序列得以平稳(图 3).因此, 建立季节性ARIMA(p, d, q)(P, D, Q)模型, 其中d=1, D=1, 季节周期s=12.

图 2 太湖Chl-a时间序列分布 Fig. 2 Chl-a time series diagram of Lake Taihu

图 3 太湖Chl-a时间序列一阶差分和一阶季节性差分序列分布 Fig. 3 Chl-a first-order difference and first-order seasonal difference sequence diagram in Lake Taihu

1.3.2 模型的识别和定阶

ARIMA(p, d, q)的一般模型形式[18]为:

(2)
(3)

式中, yt是时间序列; d是使变换后的序列平稳的差分顺序; ▽dytytd阶差(即d=0时▽dyt=yt; d=1时▽dyt=yt-yt-1; d=2时▽dyt=yt-2yt-1+yt-2等); p(非负整数)是自回归阶数, {φ1, φ2, …, φp}是自回归系数; q(非负整数)是移动平均阶数, {θ1, θ2, …, θq}是移动平均数部分的参数; {εt}是一系列相同且独立分布的正态随机变量, 均值为零, 共同方差为σ2.等式的左侧是自回归部分, 右侧是移动平均值.季节性ARIMA模型标记为ARIMA(p, d, q)(P, D, Q), PDQ分别代表季节周期的自回归的阶、差分次数和移动平均的阶[19].

根据差分后序列的自相关函数图和偏自相关函数图(图 4)确定pq[20].季节性参数PQ则通过从低阶向高阶逐步试探的方法获得.引入TN、TP、高锰酸盐指数、NH4+-N、MAT和MR影响Chl-a浓度变动的环境因子作为自变量, 增加到时间序列模型的拟合中, 根据贝叶斯信息准则(bayesian information criterion, BIC), 选取BIC值最小的模型[21].本文中最小BIC(4.87)模型为拟合的最佳模型ARIMA(0, 1, 1)(0, 1, 1).

图 4 太湖Chl-a时间序列一阶差分和一阶季节性差分序列自相关及偏相关函数 Fig. 4 Autocorrelation and partial correlation function graphs of the first-order difference and the first-order seasonal difference sequence of the Chl-a time series in Lake Taihu

1.3.3 模型的诊断检验

平稳的R2是序列中由模型解释的总变异所占比例的估计值, 模型ARIMA(0, 1, 1)(0, 1, 1)的平稳R2为0.632, 表示模型拟合效果较好.Sig.值代表Ljung-Box统计量的显著性的值, 该模型Sig.值大于0.05, 且Ljung-Box统计量为25.498, 表示模型残差的错误是随机的.从Chl-a残差自相关及偏相关中可以看出(图 5), 残差序列基本不存在相关性, 位于置信区间内, 可以看做白噪声序列, 可见所建立的模型是比较可靠的.

图 5 Chl-a残差序列自相关及偏相关置信区间分布 Fig. 5 Chl-a residual sequence autocorrelation and partial correlation

1.3.4 模型的拟合及预测

根据所建的ARIMA模型对1999年12月~2019年6月Chl-a数据进行拟合, 并采用2019年7~8月Chl-a浓度进行验证.自变量的取值采用自变量时间序列预测方法确定.

1.4 模型评估标准

采用均方根误差(RMSE)、纳什效率系数(NSE)和决定系数(R2)这3个指标对模型拟合的效果进行评价[22].

(4)
(5)
(6)

式中, xixixiave分别表示观测值、预测值和观测值的平均值, n 为数据长度, SSR(回归平方和)是指模型解释的变异, SSTO(总平方和)是指模型的总变异, SSE(残差平方和)是指y的估计值与y的实际值的离差平方和.RMSE值为0表示观测值与预测值完全吻合; NSE参数决定了剩余方差(噪声)相对于测量数据(信息)中方差的相对重要性, 取值范围为负无穷至1.NSE接近1表示模拟效果好, 模型可信度高, 接近0表示模拟结果接近观测值的平均值水平, 即总体结果可信, 但过程模拟误差大; R2取值为0~1, 越大表示模型拟合效果越好.调整R2同时考虑了样本量(n)和回归中自变量的个数(k)的影响, 平稳R2是序列稳定后的R2.

1.5 数据处理与结果分析

所有数据用Excel 2010处理, Origin 8.5作图, 由SPSS 21.0进行主成分分析和建立多元线性逐步回归方程, 应用ARIMA(p, d, q)(P, D, Q)模型对太湖Chl-a浓度进行模拟.

2 结果与分析 2.1 太湖Chl-a及环境因子分布特征

1999年12月~2019年8月的月度Chl-a均值及其分布特征如图 6, 太湖水体中Chl-a浓度水平分布于2.61~110.0 mg·m-3[(25.33±17.64) mg·m-3, 平均值±方差, 下同], 总体上处于上升趋势.从2001年平均水平16.12 mg·m-3, 逐渐上升至2018年平均水平31.33 mg·m-3, 其中在2006年和2017年分别出现一次年度高峰值36.93 mg·m-3和45.54 mg·m-3.太湖水体Chl-a浓度随时间变化较为明显, 具有季节性分布特性, 从各个月份来看, 冬季的2月平均水平最低[(13.67±4.80) mg·m-3], 夏季的8月平均水平最高[(44.8±22.48) mg·m-3].近年的2016~2018年的各月Chl-a水平均要高于2000~2002年的相应月份.

图 6 近20年来太湖水体Chl-a月度浓度分布及年均值 Fig. 6 Monthly Chl-a concentration distributions and annual average values in Lake Taihu in the past 20 years

太湖水体中TN和NH4+-N在2006年峰值以后, 总体上呈不断下降的趋势, 而TP和高锰酸盐指数呈上下波动变化(图 7).TN和NH4+-N的月度平均质量浓度最大值分别出现在4月[(3.12±0.58) mg·L-1]和3月[(0.57±0.35) mg·L-1], 最小值则分别出现在10月[(1.39±0.29) mg·L-1]和8月[(0.17±0.11)mg·L-1].TP和高锰酸盐指数的月度平均质量浓度最大值都出现在8月[分别为(0.092±0.024) mg·L-1和(5.16±0.83) mg·L-1], 其次是9月[分别为(0.085±0.021) mg·L-1和(5.11±1.02) mg·L-1], 最小值则都出现在7月[分别为(0.062±0.019) mg·L-1和(4.32±0.80) mg·L-1].近20年来太湖地区月均气温分布于0.55~32.3℃, 月均最高气温发生在7或8月, 月均最低气温发生在1、2或12月, 降雨量则与气温分布呈现相似的规律(图 8).

图 7 近20年来太湖水体月度营养盐质量浓度分布 Fig. 7 Distribution of monthly nutrient salt concentrations in Lake Taihu in the past 20 years

图 8 近20年来太湖地区月均气温及月降水量分布 Fig. 8 Distribution of monthly average temperature and monthly rainfall in Lake Taihu in the past 20 years

总体上, TP、高锰酸盐指数、MAT和MR与Chl-a浓度变化规律存在较好地同步性, TN和NH4+-N则表现出明显的滞后性.

2.2 Chl-a浓度与环境因子的关系分析

基于1999~2019年水文气象要素、水环境水生态指标等进行主成分分析(表 1表 2)发现, 成分中前3个成分特征值均大于1, 且累计贡献率为78.75%, 故可以提取前3个因子作为对Chl-a变化的79.00%的解释.其中第一主成分为TN和NH4+-N, 第二主成分为TP和高锰酸盐指数, 第三主成分为MAT和MR, 说明太湖水体Chl-a的变化开始受到营养盐和气象条件等因素的综合影响, 而不仅仅是基于N和P等限制性因素.

表 1 1999~2019年太湖月均水文气象和水环境指标主成分分析总方差 Table 1 Principal component analysis total variance of monthly average hydrometeorological and water environmental indicators of Lake Taihu from 1999 to 2019

表 2 1999~2019年太湖月均水文气象、水环境指标主成分分析得分系数 Table 2 Principal component analysis score coefficients of monthly hydrometeorological and water environmental indicators of Lake Taihu from 1999 to 2019

2.3 太湖Chl-a浓度的预测模型比较

经过太湖水质分析和环境因子主成分分析, 得出影响Chl-a浓度的主成分主要包括TN和NH4+-N、TP和高锰酸盐指数、MAT和MR.以此构建因变量Y为太湖Chl-a浓度, 自变量为环境因子的多元线性逐步回归方程:Y(Chl-a)=11.071高锰酸盐指数-31.224NH4+-N+0.307MAT-22.442.根据该回归方程及各自变量的预测值可对相应时刻Chl-a的浓度进行预测.同时, 构建了基于1999年12月至2019年6月为训练集的模型ARIMA(1, 1, 1)(0, 1, 1).其次, 构建考虑引入TN、TP、高锰酸盐指数、NH4+-N、MAT和MR环境因子作为自变量的模型ARIMA(0, 1, 1)(0, 1, 1).根据所建的3种Chl-a浓度预测模型对历史数据进行拟合评估(图 9), 模型Y(Chl-a)决定系数(调整R2)=0.488, 均方根误差(RMSE)=12.78, 纳什系数(NSE)=0.546, 其拟合值总是稍高或稍低于实测值[图 9(a)]; 模型ARIMA(1, 1, 1)(0, 1, 1)平稳的R2=0.531, RMSE=13.30, NSE=0.412, 其预测趋势与实测趋势大体一致, 但Chl-a浓度的极值点拟合效果较差[图 9(b)]; 模型ARIMA(0, 1, 1)(0, 1, 1)平稳的R2=0.632, RMSE=10.89, NSE=0.611, 其预测趋势与实测趋势基本一致, 且大部分的峰值和谷值都拟合较好[图 9(c)].经综合比较, 模型ARIMA(0, 1, 1)(0, 1, 1)拟合效果较好, 能很好地描述该太湖Chl-a浓度的动态变化.

图 9 太湖水体中Chl-a浓度各模型拟合效果 Fig. 9 Fitting effects of the measured and analog values of Chl-a in Lake Taihu

采用2019年7~8月的Chl-a浓度对所构建的模型ARIMA(0, 1, 1)(0, 1, 1)、ARIMA(1, 1, 1)(0, 1, 1)和Y(Chl-a)进行比较验证(表 3).模型ARIMA(0, 1, 1)(0, 1, 1)预测值对7月和8月实测值的相对误差分别为21.10%和8.62%, 模型ARIMA(1, 1, 1)(0, 1, 1) 预测值的相对误差分别为27.38%和14.40%, Y(Chl-a)预测的相对误差分别为60.41%和33.83%.模型ARIMA(1, 1, 1)(0, 1, 1)预测的相对误差低于模型Y(Chl-a), 但两者的预测精度均低于模型ARIMA(0, 1, 1)(0, 1, 1), 说明引入自变量的时间序列模型ARIMA(0, 1, 1)(0, 1, 1)对太湖Chl-a含量预测具有较高精度, 能比较准确地反映太湖Chl-a浓度短期的变化.

表 3 3种模型对2019年7~8月太湖水体Chl-a浓度的验证/mg·m-3 Table 3 Validation of the three models for Chl-a concentration predictions in Lake Taihu from July to August 2019/mg·m-3

2.4 ARIMA模型自变量优化

在ARIMA模型预测应用中, 数据的预处理以及数据的输入对模型的成功建立至关重要[23], 其中自变量的取值方法是一项重要的步骤.对比3种自变量取值方法(最近一期、最近三期平均值以及时间序列预测值)的预测值(表 4), 结果表明代入时间序列预测自变量的值, ARIMA模型预测值的相对误差最小, 比采用最近一期和最近三期平均值的相对误差分别减少了10.27%~14.34%和1.96%~5.71%.

表 4 自变量不同取值方法下2019年7~8月太湖水体Chl-a浓度预测值/mg·m-3 Table 4 Chl-a concentration predictions in Lake Taihu from July to August 2019 under different methods of independent variables/mg·m-3

总的来说, ARIMA模型较多元线性逐步回归模型具有更好的预测性能, 对Chl-a的月平均浓度预测具有足够的精度, ARIMA模型输入主要环境因素作为自变量及采用时间序列预测自变量值, 可以提高它在预测中的适用性.

3 讨论

湖泊水体中Chl-a的发展演变往往是区域内社会经济、水文气象和土地利用等多种因素综合作用的结果.特别是随着环境因素的逐渐改变和浮游植物的适应性变化, 决定浮游植物生长繁殖的环境因素逐渐由一元走向多元, 由单一效应发展为叠加效应.线性回归方程能较好地总结归纳出基于历史资料的最佳拟合效果[24, 25], 特别是考虑多元环境因素的综合效应后, 其拟合效果有了较大提升.然而, 湖泊水体中Chl-a是随时间变化而变化, 具有明确时间先后顺序的时间序列, 它的发展一方面遵循季节性生命周期规律另一方面也逐渐适应了区域环境的发展.线性回归方程往往注重历史资料的平均效应, 对于某些变量来说, 影响其发展变化的因素太多, 或者是主要影响变量的数据难以收集, 以致于难以建立回归模型来发现其变化发展规律.

ARIMA模型对含有季节因素的时间序列具有较好地适用性, 该模型在预测过程中不仅考虑了研究过程的依赖性, 还考虑了随机波动的干扰[26].本文中ARIMA模型能较好地预测出太湖Chl-a浓度变化的趋势, 且考虑自变量影响的ARIMA模型对极值点拟合效果也比较吻合.计算模型评估标准得出, ARIMA模型的R2较多元线性逐步回归模型提高了11.88%和29.51%, 其中引入自变量的ARIMA模型R2提高到0.632, 且RMSE降低14.79%, NSE提高了11.9%, 最终ARIMA模型较多元线性逐步回归模型预测性能提高了19.43%~39.31%.Melesse等[27]应用ARIMA模型预测美国密西西比河和密苏里河的泥沙产量, 在模拟的大多数统计性能指标上, ARIMA都比多元回归分析方法更好; Chen等[13]计算了ARIMA和多元线性逐步回归模型预测数据与观测数据之间的绝对误差(AEP)、均方根误差(RMSE)和一致性指数(IoA), ARIMA模型的AEP、RMSE均比多元线性回归模型低, 而IoA比多元线性回归模型高.这也证明了ARIMA模型模拟值与历史数据的拟合效果和预测精度较多元线性逐步回归模型更好.

Chl-a浓度不仅是具有时间效应的数据序列, 其含量也与多种环境因子有关.经过主成分分析得出影响Chl-a的环境因子主要有TN和NH4+-N、TP和高锰酸盐指数、水文气象因素, 这与前人研究结果一致[28, 29].将这些变量引入模型中, 较不加自变量的模型, 二者的信息均可靠且有效, 但增加自变量模型的平稳R2(0.632)要高于不加自变量的模型(0.546), 并且RMSE降低了18.14%, NSE提高了48.30%, 故拟合程度较之更好.Faruk等[19]使用ARIMA模型进行水质(例如DO)时间序列预测, 模型能够显示一年中高低水质值的周期, 但无法准确预测水质值每月变化幅度.而王盼盼等[30]将影响Chl-a浓度的环境因子变量引入ARIMA模型中, 较不加自变量的ARIMA模型, Chl-a浓度观测值和模拟值的拟合程度和预测效果较之更好.这表明在实际应用中将自变量作为模型的外部因素增加到时间序列分析中, 模型的拟合精度及预测精度得到进一步提高.这进一步说明, 太湖水体Chl-a的变化已经开始依赖于多维综合因素的变化, 而不仅仅是单个因素所能决定的.

4 结论

(1) 太湖Chl-a浓度存在着明显的季节变化, 它的变化开始依赖于多维因素变化的综合效应.其中TP、高锰酸盐指数、MAT和MR与Chl-a含量变化规律存在较好的同步性, TN和NH4+-N则表现出明显的滞后性.

(2) 基于近20年来月度资料建立的Chl-a时间序列模型ARIMA(1, 1, 1)(0, 1, 1)较多元线性逐步回归模型对太湖Chl-a浓度短期变化有较好的预测性能, 将重要环境因子作为变量输入且采用时间序列方法赋值自变量后所得模型ARIMA(0, 1, 1)(0, 1, 1)的预测精度进一步提高.

(3) ARIMA模型对太湖藻华的短期预测预警有较大的应用潜力, 在之后的时间序列分析中可以考虑按太湖富营养化程度进行分区建模, 合理设定环境变量及其取值, 进一步完善和验证ARIMA模型在太湖水生态环境管理中的应用.

参考文献
[1] Carvalho L, Poikane S, Solheim A L, et al. Strength and uncertainty of phytoplankton metrics for assessing eutrophication impacts in lakes[J]. Hydrobiologia, 2013, 704(1): 127-140. DOI:10.1007/s10750-012-1344-1
[2] Oliver S K, Collins S M, Soranno P A, et al. Unexpected stasis in a changing world: lake nutrient and chlorophyll trends since 1990[J]. Global Change Biology, 2017, 23(12): 5455-5467. DOI:10.1111/gcb.13810
[3] Wang F, Wang X, Chen B, et al. Chlorophyll a simulation in a lake ecosystem using a model with wavelet analysis and artificial neural network[J]. Environmental Management, 2013, 51(5): 1044-1054. DOI:10.1007/s00267-013-0029-5
[4] Chen M J, Li J, Dai X, et al. Effect of phosphorus and temperature on chlorophyll a contents and cell sizes of Scenedesmus obliquus and Microcystis aeruginosa[J]. Limnology, 2011, 12(2): 187-192. DOI:10.1007/s10201-010-0336-y
[5] Mayora G, Devercelli M, Giri F. Spatial variability of chlorophyll-a and abiotic variables in a river-floodplain system during different hydrological phases[J]. Hydrobiologia, 2013, 717(1): 51-63. DOI:10.1007/s10750-013-1566-x
[6] de Oliveira Marcionilio S M L, Machado K B, Carneiro F M, et al. Environmental factors affecting chlorophyll-a concentration in tropical floodplain lakes, Central Brazil[J]. Environmental Monitoring and Assessment, 2016, 188(11). DOI:10.1007/s10661-016-5622-7
[7] 吴召仕, 张路, 刘宝贵, 等. 鄱阳湖丰水期水体中叶绿素a含量空间分布及其与环境因子的关系[J]. 湿地科学, 2014, 12(3): 286-292.
Wu Z S, Zhang L, Liu B G, et al. Spatial distribution of chlorophyll a in Poyang Lake during wet season and its relationship with environmental factors[J]. Wetland Science, 2014, 12(3): 286-292.
[8] Staehr P A, Baastrup-Spohr L, Sand-Jensen K, et al. Lake metabolism scales with lake morphometry and catchment conditions[J]. Aquatic Sciences, 2012, 74(1): 155-169. DOI:10.1007/s00027-011-0207-6
[9] Wu Z S, Cai Y J, Liu X, et al. Temporal and spatial variability of phytoplankton in Lake Poyang: the largest freshwater lake in China[J]. Journal of Great Lakes Research, 2013, 39(3): 476-483. DOI:10.1016/j.jglr.2013.06.008
[10] 黄毅. SARIMA模型在月平均温度时间序列中的应用[D]. 北京: 北京邮电大学, 2012.
Huang Y. The SARIMA model in the monthly average temperature time series applications[D]. Beijing: Beijing University of Posts and Telecommunications, 2012.
[11] Liu H, Tian H Q, Li Y F. Comparison of two new ARIMA-ANN and ARIMA-Kalman hybrid methods for wind speed prediction[J]. Applied Energy, 2012, 98: 415-424. DOI:10.1016/j.apenergy.2012.04.001
[12] Box G E P, Jenkins G M. Time series analysis: forecasting and control[M]. San Francisco, CA: Holden-Day, 1976.
[13] Chen Q W, Guan T S, Liu Y, et al. Online forecasting chlorophyll a concentrations by an auto-regressive integrated moving average model: Feasibilities and potentials[J]. Harmful Algae, 2015, 43: 58-65. DOI:10.1016/j.hal.2015.01.002
[14] 龚绍琦, 黄家柱, 李云梅, 等. 应用时间序列分析法对太湖叶绿素-α含量的动态研究[J]. 海洋与湖沼, 2008, 39(6): 591-598.
Gong S Q, Huang J Z, Li Y M, et al. The time series of chlorophyll-α content in Taihu Lake[J]. Oceanologia et Limnologia Sinica, 2008, 39(6): 591-598. DOI:10.3321/j.issn:0029-814X.2008.06.008
[15] 尹义星, 许有鹏, 张小娜, 等. 基于时间序列分解方法的太湖未来特征水位预测[J]. 水土保持通报, 2012, 32(4): 172-175.
Yin Y X, Xu Y P, Zhang X N, et al. Forecasting characteristic water levels of Taihu Lake based on time series decomposing method[J]. Bulletin of Soil and Water Conservation, 2012, 32(4): 172-175.
[16] 吕佳佩, 张振飞, 刘杨, 等. 太湖重点区域多介质水体中有机磷酸酯的分布特征及来源解析[J]. 环境科学, 2020, 41(12): 5438-5447.
Lü J P, Zhang Z F, Liu Y, et al. Distribution characteristics and source identification of organophosphate esters in key waters areas of Taihu Lake[J]. Environmental Science, 2020, 41(12): 5438-5447.
[17] 何晓群, 刘文卿. 应用回归分析[M]. 北京: 中国人民大学出版社, 2001: 248.
He X Q, Liu W Q. Applied regression analysis[M]. Beijing: Renmin University of China Press, 2001: 248.
[18] Tiao G C. Time series: ARIMA methods[A]. In: Smelser N J, Baltes P B (Eds.). International Encyclopedia of the Social & Behavioral Sciences[M]. Chicago: University of Chicago, 2001. 363-407.
[19] Faruk D Ö. A hybrid neural network and ARIMA model for water quality time series prediction[J]. Engineering Applications of Artificial Intelligence, 2010, 23(4): 586-594. DOI:10.1016/j.engappai.2009.09.015
[20] Mishra A K, Desai V R. Drought forecasting using stochastic models[J]. Stochastic Environmental Research and Risk Assessment, 2005, 19(5): 326-339. DOI:10.1007/s00477-005-0238-4
[21] Fraley C, Raftery A E. How many clusters? Which clustering method? Answers via model-based cluster analysis[J]. The Computer Journal, 1998, 41(8): 578-588. DOI:10.1093/comjnl/41.8.578
[22] Nash J E, Sutcliffe J V. River flow forecasting through conceptual models part Ⅰ-A discussion of principles[J]. Journal of Hydrology, 1970, 10(3): 282-290. DOI:10.1016/0022-1694(70)90255-6
[23] Wilson H, Recknagel F. Towards a generic artificial neural network model for dynamic predictions of algal abundance in freshwater lakes[J]. Ecological Modelling, 2001, 146(1-3): 69-84. DOI:10.1016/S0304-3800(01)00297-6
[24] 朱广伟, 施坤, 李未, 等. 太湖蓝藻水华的年度情势预测方法探讨[J]. 湖泊科学, 2020, 32(5): 1421-1431.
Zhu G W, Shi K, Li W, et al. Seasonal forecast method of cyanobacterial bloom intensity in eutrophic Lake Taihu, China[J]. Journal of Lake Sciences, 2020, 32(5): 1421-1431.
[25] 郭子扬, 李畅游, 史小红, 等. 寒旱区呼伦湖水体叶绿素a含量的时空分布特征及其影响因子分析[J]. 生态环境学报, 2019, 28(7): 1434-1442.
Guo Z Y, Li C Y, Shi X H, et al. Spatial and temporal distribution characteristics of chlorophyll a content and its influencing factor analysis in Hulun Lake of cold and dry Areas[J]. Ecology and Environmental Sciences, 2019, 28(7): 1434-1442.
[26] 史代敏, 谢小燕. 应用时间序列分析[M]. 北京: 高等教育出版社, 2011: 293.
[27] Melesse A M, Ahmad S, McClain M E, et al. Suspended sediment load prediction of river systems: an artificial neural network approach[J]. Agricultural Water Management, 2011, 98(5): 855-866. DOI:10.1016/j.agwat.2010.12.012
[28] 张智渊, 牛远, 余辉, 等. 基于GAM模型的太湖叶绿素a含量与环境因子相关性分析[J]. 环境科学研究, 2018, 31(5): 886-892.
Zhang Z Y, Niu Y, Yu H, et al. Relationship of chlorophyll-a content and environmental factors in Lake Taihu based on GAM model[J]. Research of Environmental Sciences, 2018, 31(5): 886-892.
[29] 王玉珏, 刘哲, 张永, 等. 2010-2011年胶州湾叶绿素a与环境因子的时空变化特征[J]. 海洋学报, 2015, 37(4): 103-116.
Wang Y J, Liu Z, Zhang Y, et al. Temporal and spatial variations of chlorophyll a and environmental factors in Jiaozhou Bay in 2010-2011[J]. Haiyang Xuebao, 2015, 37(4): 103-116. DOI:10.3969/j.issn.0253-4193.2015.04.010
[30] 王盼盼. 基于决策树和相关权重的水质评价与时序预测研究[D]. 保定: 河北大学, 2018.
Wang P P. Research on water quality assessment and time series prediction based on decision tree and related weights——Take Taihu as an example[D]. Baoding: Hebei University, 2018.