环境科学  2024, Vol. 45 Issue (6): 3205-3213   PDF    
基于注意力机制优化的BiLSTM珠江口水质预测模型
陈湛峰, 李晓芳     
广东省生态环境监测中心, 广州 510308
摘要: 为提高珠江口水质预测精度和稳定性, 提出了基于时间和特征双注意力机制优化的BiLSTM水质预测模型, 引入特征注意力机制强化模型捕获参数重要特征能力, 加入时间注意力机制提高对时间序列相关性信息及水质波动细节信息的挖掘能力. 将新模型应用于珠江8个入海口水质预测, 开展预测性能试验、泛化能力试验和特征参数扩展性试验. 结果表明:①新模型在珠海大桥水质预测取得了较高的预测精度, 预测值与实测值的均方根误差RMSE为0.004 1 mg·L-1, 决定系数R2为98.3%. 与Multi-BiLSTM、Multi-LSTM、BiLSTM和LSTM对比, 表明新模型预测精度最高, 验证了模型的精准性. ②训练样本数量和预测步数均对模型预测精度产生影响, 模型预测精度随着训练样本的增加而提升, 海珠大桥断面总磷预测时, 240组以上训练样本可获得较高预测精度;增加预测步数, 会使模型预测精度迅速下降, 预测步数大于5步时无法保障模型预测的可靠性. ③将新模型应用于珠江8个入海口不同水质指标预测, 预测结果均取得较高精度, 模型具有较强的泛化能力;输入对象断面预测指标相关联的上游来水、降雨量等特征参数, 能够提高模型预测精度. 通过多方面多次试验, 结果表明新模型能够较好地满足珠江口水质预测精度、适用性和扩展性要求, 为复杂水动力环境水体水质高精度预测进行了新的探索.
关键词: 特征注意力机制      时间注意力机制      BiLSTM模型      LSTM模型      珠江口      水质预测     
Water Quality Prediction Model for the Pearl River Estuary Based on BiLSTM Improved with Attention Mechanism
CHEN Zhan-feng , LI Xiao-fang     
Guangdong Ecological and Environmental Monitoring Center, Guangzhou 510308, China
Abstract: To improve the accuracy and stability of water quality prediction in the Pearl River Estuary, a water quality prediction model was proposed based on BiLSTM improved with an attention mechanism. The feature attention mechanism was introduced to enhance the ability of the model to capture important features, and the temporal attention mechanism was added to improve the mining ability of time series correlation information and water quality fluctuation details. The new model was applied to the water quality prediction of eight estuaries of the Pearl River, and the prediction performance test, generalization ability test, and characteristic parameter expansion test were carried out. The results showed that: ① The new model achieved high prediction accuracy in the water quality prediction of the Zhuhaidaqiao section. The root-mean-square error (RMSE) between the predicted value and the measured value was 0.004 1 mg·L-1, and the coefficient of determination (R2) was 98.3%. Compared with that of Multi-BiLSTM, Multi-LSTM, BiLSTM, and LSTM, the results showed that the new model had the highest prediction accuracy, which verified the accuracy of the model. ② Both the number of training samples and the number of forecasting steps affected the prediction accuracy of the model, and the prediction accuracy of the model increased with the increase of the training samples. When predicting the total phosphorus of the Zhuhaidaqiao section, more than 240 training samples could obtain higher prediction accuracy. Increasing the number of prediction steps caused the prediction accuracy of the model to decline rapidly, and the reliability of the model prediction could not be guaranteed when the number of prediction steps was greater than 5. ③ When the new model was applied to the prediction of different water quality indexes in eight estuaries of the Pearl River, the prediction results had high precision and the model had strong generalization ability. The input data of upstream water quality, rainfall, and other characteristic parameters associated with the section prediction index of the object could improve the prediction accuracy of the model. Through many tests, the results showed that the new model could meet the requirements of precision, applicability, and expansibility of water quality prediction in the Pearl River Estuary and thus is a new exploration method for high-precision prediction of water quality in complex hydrodynamic environments.
Key words: characteristic attention mechanism      temporal attention mechanism      BiLSTM model      LSTM model      Pearl River estuary      water quality prediction     

珠江口是粤港澳大湾区的核心区域, 良好的生态环境质量是大湾区实现高质量发展的基础. 根据《2016~2020年广东省生态环境质量报告书》, 珠江口海域长年处于劣四类海水水质标准, 主要超标因子为无机氮和活性磷酸盐, 珠江口生态系统呈亚健康状态. 2022年6月, 广东省政府印发《珠江口邻近海域综合治理攻坚实施方案》, 要求到2025年珠江口海域水质优良面积比例要达73%, 其中陆源主要污染物入海量持续降低, 主要河流入海断面全面消除劣V类水体[1]. 科学准确的水质预测有助于深入了解河流入海断面水质变化规律和发展态势, 为污染防治提供水质预警信息, 保障生态环境部门决策的主动性和工作效率. 因此, 有必要强化对珠江口水质预测模型研究, 提高水质预测精度, 为珠江口水质污染治理提供科学决策参考.

珠江口河网密布, 八大口门互相勾连, 闸坝众多, 且受潮汐影响, 是我国水文水动力最复杂的区域之一. 珠江入海口污染物在水中迁移转化机制复杂, 基于机制的水质数值模型需要大量的基础数据支撑, 且模型求解存在不确定性, 难以做到高精度预测[2]. 神经网络能够捕捉多变量非线性特征[3], 且具有出色的泛化能力[4], 通过学习水质指标历史数据和相关特征参数之间的非线性映射关系, 能够定量预测水质的变化[5], 为水质预测提供了新的方向. 神经网络已在珠江口水质预测中充分运用, 如Ding等[6]采用聚类分析、主成分分析等统计分析以及门控循环单元对珠江水质进行预测;Lv等[7]提出基于注意力的长短期记忆模型(LSTM-Attention)对珠江水质预测.

循环神经网络(recurrent neural network, RNN)[8, 9]、长短期记忆网络(long short-term memory, LSTM)[10, 11]和双向长短期记忆网络(bidirectional long short-term memory, BiLSTM)[12, 13]等神经网络模型被大量应用于水质预测[14~22]. 水质数据是多维的时间序列[23], 在珠江入海口复杂的水环境条件下, 入海口水质具有更强的非线性和非平稳性[24], 传统的LSTM和BiLSTM无法处理多维时间序列数据, 多元长短期记忆网络(multiple long short-term memory, Multi-LSTM)和多元双向长短期记忆网络(multiple bidirectional long short-term memory, Multi-BiLSTM)模型夹杂过多冗余信息, 水质预测效果并不理想[25]. 近年来, 注意力机制开始应用于时间序列的分析, 在水质预测中取得较好的成效[26~36]. 本文提出基于时间和特征双注意力机制优化的BiLSTM模型(Attention-BiLSTM). 利用Multi-BiLSTM在时序预测上的优势, 捕捉多个水质指标间的非线性关系和时序上的周期性[37], 采用特征注意力机制和时间注意力机制分别提取水质多指标间的重要特征及时间上的波动关键信息[38], 消除Multi-BiLSTM的冗余变量和历史时间点的影响, 提高水质预测的效率和精度, 以期为高精度高效率预测复杂水体水质提供了新的思路.

1 材料与方法 1.1 研究区域概况与数据来源

珠江拥有多个出海口, 一般将最大的8个入海口称为“八大口门”. 八大口门是珠江三角洲的河流与海洋的分界, 口门之内水体河流特征明显, 如盐度值低, 径流量呈现季节性差异;口门之外水体海洋特征明显, 如出现明显潮汐特征, 较高的盐度值等. 八大口门中东四门:虎门、蕉门、洪奇沥门和横门位于珠江东侧, 注入伶仃洋;西四门:磨刀门、鸡啼门、虎跳门和崖门位于珠江西侧, 在黄茅海等处注入南海.

本文所用水质数据均来源于自动监测数据, 选择虎门大桥、蕉门、洪奇沥、珠海大桥、鸡啼门大桥、虎跳门水道河口、苍山渡口、中山港码头和鸡啼门大桥上游尖峰大桥这9个水站(见图 1)在2019年1月1日至2022年12月31日水质小时值和日均值作为数据集. 水质指标包含5参数(水温、pH、浊度、电导率、溶解氧)、氨氮、高锰酸盐指数、总磷和总氮;气象指标包含温度、湿度、气压、风速、风向和降雨量等.

图 1 研究区域示意 Fig. 1 Study region

1.2 研究方法 1.2.1 入海口水质数据的特征分析

不同于一般的时序预测问题, 珠江口受到河流、潮汐及其周边环境的影响, 水质除了自身的趋势性和周期性, 还会随着潮汐、季节、人为活动和气候变化等情况发生变化, 表现出高度的非平稳性和非线性特征.

1.2.2 模型原理 1.2.2.1 长短期记忆网络(LSTM)

LSTM是由RNN演变而来, 通过优化隐含节点单位结构(信息过滤和门控结构设计)缓解梯度消失和梯度爆炸的问题[39]. LSTM能够很好地处理水质数据的时序依赖性特征, 是水质预测的基本模型.

LSTM由遗忘门、输入门和输出门这3个门控单元组成[40](见图 2). LSTM计算过程如下.

图 2 LSTM单元结构 Fig. 2 Unit structure of LSTM

遗忘门:

(1)

输入门:

(2)
(3)
(4)

输出门:

(5)
(6)

式中, xtt时刻的输入, htht-1分别为tt-1时刻的隐含层输出状态, CtCt-1分别为tt-1时刻的记忆单元状态, 为记忆单元候选状态, fio分别为遗忘门、输入门和输出门, Wb分别为权重参数和偏置参数, tanh为双曲正切激活函数, σ为sigmoid激活函数.

1.2.2.2 双向长短期记忆网络(BiLSTM)

LSTM只能学习沿时间轴向前的信息, 考虑到水质数据具有显著的时间和上下游空间关系, BiLSTM能够更深度地挖掘水质时间序列的特征. BiLSTM由两层方向相反的LSTM组成, 结合向前和向后2个方向上的数据特征对当前时刻的数据进行预测[41](见图 3), 分别为向前和向后隐藏状态, 计算过程如下.

(7)
(8)
(9)
图 3 BiLSTM网络结构 Fig. 3 Network structure of BiLSTM

1.2.2.3 多元双向长短期记忆网络(Multi-BiLSTM)

BiLSTM受限于自身网络结构, 只能对单特征时间序列进行学习预测, 难以获取水质各项指标之间的关系特征. 现有研究表明, 基于水质数据的多元相关性可以更准确地进行水质预测[42]. 本文提出Multi-BiLSTM(多元双向长短期记忆网络), 挖掘水质各项指标间的关系特征. Multi-BiLSTM由多个BiLSTM组成, 各个BiLSTM间不是简单地组合, 而是将水质数据特征按照时间序列和水质指标2个方向进行传递, 遍历所有水质指标和时间序列后的特征信息存入记忆单元(见图 4). 多元双向长短期记忆网络较为复杂, 为更精准的捕捉水质突变信息, 解决自身网络在突变时难以做出及时反应的问题, 减少神经元之间复杂的共适应关系, 阻止过拟合情况, 在网络中增加特征检测器Dropout, 让网络学习更加鲁棒的特征.

图 4 Multi-BiLSTM网络结构 Fig. 4 Network structure of Multi-BiLSTM

1.2.3 模型优化

虽然Multi-BiLSTM能够完成水质数据时间序列及多指标特征的学习, 并能较为精准地预测. 但是, 受到等价考虑所有的输入时间序列和输入水质指标特征这一设定的限制, 不可避免地会夹杂冗余信息. 注意力机制具有强大的捕获时间多尺度依赖性的功能, 能够较好地对水质时间序列自相关性和水质指标特征相关性进行捕捉, 让预测模型对重点信息充分关注[43], 本文引入注意力机制对预测模型进行优化.

1.2.3.1 注意力机制

注意力机制的应用主要分为两个步骤[44], 一是编码, 在这阶段对重要的变量加权, 得到每个隐含状态对预测输出的重要性权重αt;二是解码, 将通过注意力机制更新后的向量ct和先前的历史信息融合, 得到t时刻的输出 , 计算过程如下:

(10)
(11)
(12)
1.2.3.2 特征注意力机制

水质指标间存在密切关系, 水质波动往往伴随着多个指标的变动, 为了更好地探索多变量时序相关性, 本文引入特征注意力机制进行特征提取, 优化Multi-BiLSTM模型. 通过有监督的方式更新神经网络参数来调整注意力分配, 生成特征权重, 减少冗余信息, 提高预测精度[45]. 根据t-1时刻隐含层和记忆单元信息的组合etn, 通过Softmax函数得到特征注意力权重αt, 利用权重参数将更新后输入变量通过Concat函数连接起来得到特征分配权重后优化的输入特征向量 (见图 5), 计算过程如下:

(13)
(14)
(15)
图 5 特征注意力机制示意 Fig. 5 Schematic of the characteristic attention mechanism

1.2.3.3 时间注意力机制

Multi-BiLSTM对所有的输入时间序列赋以同样的权重, 然而, 水质预测中往往不同时段的水质数据对预测结果影响是不一样的. 本文引入时间注意力机制对预测模型进行优化, 时间注意力机制来获取输入序列的过去特征[46]. 将特征注意力机制更新后的输入特征向量 作为编码器的输入, 更新编码器隐含层状态ht;在解码阶段, 根据t-1时刻的隐含层状态(dt-1)和记忆单元状态(ct-1)计算编码隐藏状态注意力分数lti, 通过Softmax函数得到t时刻时间注意力权重βti, 与编码器隐含层状态ht组合得到更新后的编码器隐含层状态ct, 最后将ct输入BiLSTM进行预测(见图 6), 计算过程如下:

(16)
(17)
(18)
(19)
图 6 时间注意力机制示意 Fig. 6 Schematic of temporal attention mechanism

1.2.4 结果评价指标

为了评价模型的预测效果, 本文选取了均方根误差(RMSE)和决定系数(R2)这2个指标进行评价, 计算见式(20)和式(21).

(20)
(21)

式中, 为预测值, y为实测值, 为均值, n为数据总数.

2 结果与讨论 2.1 模型预测性能试验

为了验证Attention-BiLSTM(基于时间和特征双注意力机制优化的BiLSTM模型)在河流入海口水质预测的性能, 将该模型与Multi-BiLSTM、Multi-LSTM(与上文所述Multi-BiLSTM模型原理和网络结构一致, 将BiLSTM替换为LSTM)、BiLSTM、LSTM等模型进行预测试验比对. 比对对象选择磨刀门水道入海口珠海大桥站点, 磨刀门水道入海口是西江径流的主要出海口, 径流量超过珠江总径流量的1/4, 输沙量占1/3, 且河网纵横密布, 是珠江流域水文水动力最复杂的入海口之一. 珠海大桥站点水质的定类项目为总磷, 选择总磷作为模型预测试验的指标. 结合水质预测的使用需求, 比对试验分2个时间尺度进行, 一是比较小时尺度(总磷每4h自动监测一次)预测结果, 二是比较日尺度(日均值)预测结果.

2.1.1 模型预测精度分析

选取2019年1月1日至2022年12月31日珠海大桥水站有效水质数据日均值, 数据包含9个水质指标(水温、pH、浊度、电导率、溶解氧、氨氮、高锰酸盐指数、总磷、总氮)每个指标1 321组. 由于相关变量增加会增加模型的复杂度, 且会大大降低模型的预测能力, 只选择与总磷相关性较强的浊度、氨氮、高锰酸盐指数为特征指标, 作为多元输入变量, 前90%(1~1 921数据组)作为训练集, 后10%(1 922~2 134数据组)作为测试集. 经反复试验, Attention-BiLSTM训练参数为:优化函数Adam, 学习率0.005, 训练次数200. 本试验结果表明, Attention-BiLSTM模型预测效果较好(见图 7), 预测值与实测值的均方根误差RMSE为0.004 1 mg·L-1, 决定系数R2为98.35%(见表 1). 与Multi-BiLSTM、Multi-LSTM、BiLSTM和LSTM模型相比, Attention-BiLSTM模型预测结果精度最高, 均方根误差RMSE分别降低了53.4%、51.9%、63.5%和74.8%, 决定系数R2分别增加了4.1%、5.8%、12.2%和13.6%. Multi-LSTM在处理短时序双峰突变中小峰值预测效果比Attention-BiLSTM和Multi-BiLSTM好(图 7中时序1 225~1 235), Attention-BiLSTM和Multi-BiLSTM都采用了BiLSTM作为基础模型, 短时序双峰情况下, 双向突变叠加, 影响了预测精度.

图 7 模型预测结果对比 Fig. 7 Comparing the daily-scale prediction results

表 1 珠海大桥断面模型预测评价结果 Table 1 Evaluation of the model prediction results of Zhuhaidaqiao section

2.1.2 训练样本数量对预测精度影响分析

在模型预测精度分析时, 本文使用大量实测数据作为训练集(训练样本数量大于1 200组)对模型进行训练, 取得了较高的预测精度. 为了分析训练样本数量对模型预测精度影响, 本文模拟使用场景, 在模型预测的基础上, 设置相同的超参数, 将不同数量的训练样本输入模型进行训练, 连续单步预测100组, 统计分析预测结果评价指标. 训练样本数量设置原则为第1年每30组递增, 第2年开始, 训练样本数量每360组递增, 即分别为30、60、90、120、150、180、210、240、270、300、330、360、720和1 080. 本试验结果表明(见图 8):模型预测精度随着训练样本的增加而提升, 样本数量较少时, 增加样本能够快速地提高模型预测精度, 等样本到一定数量后, 通过增加样本方式提高模型预测精度有限. 使用Attention-BiLSTM模型预测海珠大桥断面总磷浓度时, 120组训练样本以下, 模型单步预测值未能取得较高的精度, R2 < 90%, 240组训练样本以上, 模型单步预测值能够取得较高的精度, R2 > 95%. 相同数量的不同训练样本也会影响预测结果精度, 如用于验证预测精度的实测值中数据存在较大变化, 大于/小于训练样本中输入的最大值/最小值, 预测结果会偏小/偏大, 从而影响序列的精度评价.

图 8 不同训练样本数量下的模型预测精度 Fig. 8 Prediction accuracy of the model under different training sample quantities

2.1.3 预测步数对预测精度影响分析

单步预测往往能够获得较高的预测精度, 在多步预测时, 使用前序序列预测值代替实测值作为输入进行递归多步预测, 由此会随着预测步数的增加而累计预测误差, 且将预测值作为输入, 机器学习无法学习到更多的新规则, 预测值将沿用同样的规则进行预测, 预测精度将会逐步降低, 模型的性能会迅速下降. 为了分析预测步数对模型预测精度影响, 在模型预测的基础上, 设置相同的超参数, 使用训练好的相同网络, 按不同预测步数方式进行预测, 预测结果组成100组, 统计分析预测结果评价指标. 本试验结果表明(见图 9):增加预测步数, 会使模型预测精度迅速下降, 预测步数大于5步时, R2 < 50%, 已无法保障模型预测结果的可靠性.

图 9 不同预测步数下的模型预测精度 Fig. 9 Prediction accuracy of the models with different prediction steps

2.2 模型泛化能力试验

为了验证Attention-BiLSTM模型对其他入海口及其他水质指标预测能力, 本文选取珠江八大口门断面进行试验. 根据2022年水质定类指标, 确定入海口预测的水质指标及相关指标, 珠海大桥总磷上文已经做过分析, 预测指标改为高锰酸盐指数, 根据预测指标不同, 选择与之相关的指标作为输入参数, 见表 2.

表 2 预测指标清单 Table 2 List of predictive indicators

选取2019年1月1日至2022年12月31日珠海大桥水站有效水质数据日均值, 按照对应好的预测指标和相关指标, 选择数据集的前90%数据作为训练集, 后10%数据作为测试集. 训练参数为:优化函数Adam, 学习率0.005, 训练次数200. 分别对8个断面水质日均值进行训练、预测, 统计分析测试集的评价结果. 预测评价结果表明(表 3):Attention-BiLSTM模型对珠江八大口门均有很好的预测效果, 均方根误差RMSE均达到较小值, 决定系数R2均高于95%.

表 3 珠江8大口门水质预测结果评价情况 Table 3 Evaluation of water quality prediction results in eight estuaries of the Pearl River

2.3 特征参数扩展性试验

为了验证输入非对象断面水质指标的特征参数时Attention-BiLSTM的预测能力, 本文选择降雨量、鸡啼门大桥上游尖峰大桥断面总磷等特征参数进行组合输入, 验证Attention-BiLSTM的预测能力. 对鸡啼门大桥和特征参数进行预处理, 按时间序列统一排列, 前90%数据作为训练集, 后10%数据作为测试集. 训练参数为:优化函数Adam, 学习率0.005, 训练次数200. 本试验结果发现(表 4), 输入有关联的非对象断面水质指标的特征参数时, 预测精度有所提高;输入上游断面总磷数据时, 均方根误差RMSE降低27.3%, 决定系数R2提高0.76%;输入降雨量数据时, 均方根误差RMSE降低80.0%, 决定系数R2提高1.47%;输入上游断面总磷数据、降雨量数据时, 均方根误差RMSE降低80.8%, 决定系数R2提高2.38%. 可以看出, 降雨量与鸡啼门大桥断面总磷指标相关性较高, 输入降雨量预测结果比上游来水、断面本身其他指标获得更高的预测精度;输入鸡啼门大桥总磷、尖峰大桥总磷、降雨量组合数据集时, 取得最好的预测效果.

表 4 鸡啼门大桥断面不同特征参数预测结果1) Table 4 Evaluation results of water quality prediction results of Jitimendaqiao section with different characteristic parameters

3 结论

(1)本文在水文水动力极复杂的珠江入海口水质预测的基础上, 优化、改进深度学习模型, 提出基于时间和特征双注意力机制优化的BiLSTM模型. 引入特征注意力机制强化参数重要特征捕获, 加入时间注意力机制提高对时间序列相关性信息及水质波动的细节信息的挖掘能力, 提升水质预测的效率和精度.

(2)通过模型预测试验, Attention-BiLSTM模型在珠海大桥断面总磷预测中取得较高精度, 并深入分析了训练样本数量、预测步数对模型预测精度的影响;模型能够对不同入海口不同的水质指标进行预测, 且取得较好的预测结果, 具有较强的泛化能力;输入对象断面预测指标相关联的上游来水、降雨量等特征参数, 能够提高模型预测精度, 模型特征参数具有较好的扩展性.

(3)目前Attention-BiLSTM模型仍有提升的空间, 如当出现短时序双峰突变, 双峰之间的峰值不能很好地捕捉, 不可避免地影响预测效果. 下一步将加强短时序双峰突变预测问题研究, 进一步优化注意力机制, 研究模型识别短时序双峰突变方法, 提高期间特征注意力机制权重, 降低时间注意力机制权重, 进一步提高模型的精度.

参考文献
[1] 张子俊, 张迅. 珠江口水质优良面积将达73%[N]. 南方日报, 2022-08-19(A08).
[2] Kadkhodazadeh M, Farzin S. Introducing a novel hybrid machine learning model and developing its performance in estimating water quality parameters[J]. Water Resources Management, 2022, 36(10): 3901-3927. DOI:10.1007/s11269-022-03238-6
[3] Liu Y F, Liu Y, Cai H H, et al. An innovative short-term multihorizon photovoltaic power output forecasting method based on variational mode decomposition and a capsule convolutional neural network[J]. Applied Energy, 2023, 343. DOI:10.1016/J.APENERGY.2023.121139
[4] Yang Z M, Liu Z, Zhou J, et al. A graph neural network (GNN) method for assigning gas calorific values to natural gas pipeline networks[J]. Energy, 2023, 278. DOI:10.1016/J.ENERGY.2023.127875
[5] Fu X H, Zheng Q X, Jiang G M, et al. Water quality prediction of copper-molybdenum mining-beneficiation wastewater based on the PSO-SVR model[J]. Frontiers of Environmental Science & Engineering, 2023, 17(8). DOI:10.1007/S11783-023-1698-9
[6] Ding H N, Niu X J, Zhang D Q, et al. Spatiotemporal analysis and prediction of water quality in Pearl River, China, using multivariate statistical techniques and data-driven model[J]. Environmental Science and Pollution Research, 2023, 30(22): 63036-63051. DOI:10.1007/s11356-023-26209-9
[7] Lv M Y, Niu X J, Zhang D Q, et al. A data-driven framework for spatiotemporal analysis and prediction of river water quality: a case study in Pearl River, China[J]. Water, 2023, 15(2). DOI:10.3390/w15020257
[8] Georgescu P L, Moldovanu S, Iticescu C, et al. Assessing and forecasting water quality in the Danube River by using neural network approaches[J]. Science of the Total Environment, 2023, 879. DOI:10.1016/J.SCITOTENV.2023.162998
[9] Zhang Y F, Fitch P, Thorburn P J. Predicting the trend of dissolved oxygen based on the kPCA-RNN model[J]. Water, 2020, 12(2). DOI:10.3390/w12020585
[10] Zhang L, Jiang Z Q, He S S, et al. Study on water quality prediction of urban reservoir by coupled CEEMDAN decomposition and LSTM neural network model[J]. Water Resources Management, 2022, 36(10): 3715-3735. DOI:10.1007/s11269-022-03224-y
[11] Li Q, Yang Y Q, Yang L, et al. Comparative analysis of water quality prediction performance based on LSTM in the Haihe River Basin, China[J]. Environmental Science and Pollution Research, 2023, 30(3): 7498-7509. DOI:10.1007/s11356-022-22758-7
[12] Bi J, Zhang L Y, Yuan H T, et al. Multi-indicator water quality prediction with attention-assisted bidirectional LSTM and encoder-decoder[J]. Information Sciences, 2023, 625: 65-80. DOI:10.1016/j.ins.2022.12.091
[13] 欧阳特. 基于BiLSTM和迁移学习的水质预测方法研究[D]. 武汉: 武汉大学, 2021.
Ouyang T. Water quality prediction method based on BiLSTM and transfer learning[D]. Wuhan: Wuhan University, 2021.
[14] Jiang Y Q, Li C L, Sun L, et al. A deep learning algorithm for multi-source data fusion to predict water quality of urban sewer networks[J]. Journal of Cleaner Production, 2021, 318. DOI:10.1016/J.JCLEPRO.2021.128533
[15] Liu W L, Liu T X, Liu Z H, et al. A novel deep learning ensemble model based on two-stage feature selection and intelligent optimization for water quality prediction[J]. Environmental Research, 2023, 224. DOI:10.1016/J.ENVRES.2023.115560
[16] Yang J C, Jia L L, Guo Z W, et al. Prediction and control of water quality in recirculating aquaculture system based on hybrid neural network[J]. Engineering Applications of Artificial Intelligence, 2023, 121. DOI:10.1016/J.ENGAPPAI.2023.106002
[17] Jadhav A R, Pathak P D, Raut R Y. Water and wastewater quality prediction: current trends and challenges in the implementation of artificial neural network[J]. Environmental Monitoring and Assessment, 2023, 195(2). DOI:10.1007/S10661-022-10904-0
[18] Chen L X, Wu T H, Wang Z C, et al. A novel hybrid BPNN model based on adaptive evolutionary Artificial Bee Colony Algorithm for water quality index prediction[J]. Ecological Indicators, 2023, 146. DOI:10.1016/J.ECOLIND.2023.109882
[19] Nguyen K T N, François B, Balasubramanian, et al. Prediction of water quality extremes with composite quantile regression neural network[J]. Environmental monitoring and assessment, 2023, 195(2). DOI:10.1007/S10661-022-10870-7
[20] Ibrahim A, Ismail A, Juahir H, et al. Water quality modelling using principal component analysis and artificial neural network[J]. Marine pollution bulletin, 2023, 187. DOI:10.1016/J.MARPOLBUL.2022.114493
[21] Li D S, Zhang X, Yang Y F, et al. An interpretable hierarchical neural network insight for long-term water quality forecast: A study in marine ranches of Eastern China[J]. Ecological Indicators, 2023, 146. DOI:10.1016/J.ECOLIND.2022.109771
[22] Khatri N, Vyas A K, Abdul-Qawy A S H, et al. Artificial neural network based models for predicting the effluent quality of a combined upflow anaerobic sludge blanket and facultative pond: Performance evaluation and comparison of different algorithms[J]. Environmental Research, 2023, 217. DOI:10.1016/J.ENVRES.2022.114843
[23] Li Y T, Li R Y. Predicting ammonia nitrogen in surface water by a new attention-based deep learning hybrid model[J]. Environmental Research, 2022, 216. DOI:10.1016/J.ENVRES.2022.114723
[24] Hoque J M Z, Aziz N A, Alelyani S, et al. Improving water quality index prediction using regression learning models[J]. International Journal of Environmental Research and Public Health, 2022, 19(20). DOI:10.3390/IJERPH192013702
[25] Aldrees A, Awan H H, Javed M F, et al. Prediction of water quality indexes with ensemble learners: Bagging and boosting[J]. Process Safety and Environmental Protection, 2022, 168: 344-361. DOI:10.1016/j.psep.2022.10.005
[26] Li G B, Cui Q Z, Wei S N, et al. Long short-term memory network-based wastewater quality prediction model with sparrow search algorithm[J]. International Journal of Wavelets, Multiresolution and Information Processing, 2023, 21(6). DOI:10.1142/S0219691323500194
[27] Song C G, Yao L H. A hybrid model for water quality parameter prediction based on CEEMDAN-IALO-LSTM ensemble learning[J]. Environmental Earth Sciences, 2022, 81(9). DOI:10.1007/S12665-022-10380-2
[28] Huan J, Li M B, Xu X G, et al. Multi-step prediction of dissolved oxygen in rivers based on random forest missing value imputation and attention mechanism coupled with recurrent neural network[J]. Water Supply, 2022, 22(5): 5480-5493. DOI:10.2166/ws.2022.154
[29] Wang H Q, Zhang L F, Zhao H Y, et al. Feature multi-level attention spatio-temporal graph residual network: A novel approach to ammonia nitrogen concentration prediction in water bodies by integrating external influences and spatio-temporal correlations[J]. Science of the Total Environment, 2023, 906. DOI:10.1016/j.scitotenv.2023.167591
[30] Tan R, Wang Z C, Wu T H, et al. A data-driven model for water quality prediction in Tai Lake, China, using secondary modal decomposition with multidimensional external features[J]. Journal of Hydrology: Regional Studies, 2023, 47. DOI:10.1016/J.EJRH.2023.101435
[31] Xu J L, Wang K, Lin C, et al. FM-GRU: A time series prediction method for water quality based on seq2seq framework[J]. Water, 2021, 13(8). DOI:10.3390/W13081031
[32] Li W S, Wei Y G, An D, et al. LSTM-TCN: dissolved oxygen prediction in aquaculture, based on combined model of long short-term memory network and temporal convolutional network[J]. Environmental Science and Pollution Research, 2022, 29(26): 39545-39556. DOI:10.1007/s11356-022-18914-8
[33] Yang Y R, Xiong Q Y, Wu C, et al. A study on water quality prediction by a hybrid CNN-LSTM model with attention mechanism[J]. Environmental Science and Pollution Research, 2021, 28(39): 55129-55139. DOI:10.1007/s11356-021-14687-8
[34] 周泉, 胡轩铭, 王东昆, 等. 基于注意力机制优化的LSTM河流溶解氧预测模型研究[J]. 环境科学研究, 2023, 36(6): 1135-1146.
Zhou Q, Hu X M, Wang D K, et al. Prediction of dissolved oxygen in rivers based on LSTM model with improved attention mechanism[J]. Research of Environmental Sciences, 2023, 36(6): 1135-1146.
[35] 黎园园, 刘海隆. 基于注意力机制的时间卷积网络河流总磷预测[J]. 环境工程, 2023, 41(5): 163-171.
Li Y Y, Liu H L. Prediction of total phosphorus in rivers based on attention mechanism of temporal convolutional networks[J]. Environmental Engineering, 2023, 41(5): 163-171.
[36] Chen H L, Yang J B, Fu X H, et al. Water quality prediction based on LSTM and attention mechanism: a case study of the Burnett River, Australia[J]. Sustainability, 2022, 14(20). DOI:10.3390/SU142013231
[37] Liu M Y, He J Y, Huang Y Z, et al. Algal bloom forecasting with time-frequency analysis: a hybrid deep learning approach[J]. Water Research, 2022, 219. DOI:10.1016/J.WATRES.2022.118591
[38] Zhang Q, Wang R Q, Qi Y, et al. A watershed water quality prediction model based on attention mechanism and Bi-LSTM[J]. Environmental Science and Pollution Research, 2022, 29(50): 75664-75680. DOI:10.1007/s11356-022-21115-y
[39] 张磊. 基于CEEMDAN-LSTM的水库水质预测研究[D]. 武汉: 华中科技大学, 2022.
Zhang L. CEEMDAN-LSTM-based reservoir water quality prediction research[D]. Wuhan: Huazhong University of Science and Technology, 2022.
[40] 何欣. 基于GA-VMD-LSTM的河流水质预测模型的研究与应用[D]. 武汉: 华中科技大学, 2022.
He X. Research and application of river water quality prediction model based on GA-VMD-LSTM[D]. Wuhan: Huazhong University of Science and Technology, 2022.
[41] Hao X L, Liu Y, Pei L L, et al. Atmospheric temperature prediction based on a BiLSTM-attention model[J]. Symmetry, 2022, 14(11). DOI:10.3390/SYM14112470
[42] Siami-Namini S, Tavakoli N, Namin A S. The performance of LSTM and BiLSTM in forecasting time series[A]. In: 2019 IEEE International Conference on Big Data (Big Data)[C]. Los Angeles: IEEE, 2019. 3285-3292.
[43] 王李想. 基于多指标时序数据的城市河道水质异常检测方法研究[D]. 杭州: 浙江大学, 2021.
Wang L X. Research on water quality anomaly detection of urban river using Multi-indicators time series data[D]. Hangzhou: Zhejiang University, 2021.
[44] Chen M, Zang S R, Ai Z H, et al. RFA-Net: residual feature attention network for fine-grained image inpainting[J]. Engineering Applications of Artificial Intelligence, 2023, 119. DOI:10.1016/J.ENGAPPAI.2022.105814
[45] Wang H, Qin H, Liu G J, et al. A novel feature attention mechanism for improving the accuracy and robustness of runoff forecasting[J]. Journal of Hydrology, 2023, 618. DOI:10.1016/J.JHYDROL.2023.129200
[46] Cai K Q, Shen Z Q, Luo X Y, et al. Temporal attention aware dual-graph convolution network for air traffic flow prediction[J]. Journal of Air Transport Management, 2023, 106. DOI:10.1016/J.JAIRTRAMAN.2022.102301