环境科学  2025, Vol. 46 Issue (1): 318-326   PDF    
基于跨时间尺度迁移学习的污水处理模型漂移校正方法
申渝1,2, 廖万山1, 李慧敏1,3, 冯东4, 郭智威1,2, 张冰1,2, 高旭1,4, 王建辉1,2, 陈猷鹏3     
1. 重庆工商大学人工智能学院, 智能制造服务国际科技合作基地, 智能感知与区块链技术重庆市重点实验室, 重庆 400067;
2. 重庆南向泰斯环保技术研究院有限公司, 重庆 400069;
3. 重庆大学环境与生态学院, 重庆 400045;
4. 重庆中法环保研发中心有限公司, 重庆 400010
摘要: 数据是智能运维的核心基础, 但当前污水厂数据普遍不足, 且污水处理系统状态随内外部环境动态演化. 污水厂的智能运维面临着建模难度大, 及因系统演化而导致的模型漂移问题. 针对该问题, 选取水温、水质和微生物状态等都有显著差异的夏冬两季作为典型对比场景, 将机制模型与神经网络结合, 建立了基于跨时间尺度迁移学习的污水处理模型漂移校正方法. 首先, 针对数据不足问题, 建立并校准活性污泥模型(ASM), 以夏季工况数据作为输入, 模拟计算运行参数和出水数据, 生成模拟运行数据集, 实现数据增广和质量提升, 用于训练多层感知机神经网络(MLP)模型. 结果显示, MLP模型对夏季出水COD、氨氮和总磷等的平均模拟准确率在95%以上;然后, 针对模型在冬季工况中出现模拟准确率大幅下降等模型漂移问题, 将冬季实测数据作为目标域数据集, 以MLP模型作为预训练模型进行迁移学习. 结果表明, 迁移学习后模型性能显著提升, 出水COD、氨氮、总氮和总磷的平均模拟准确率分别提高了21.49%、60.79%、58.14%和46.74%. 研究提出的跨时间尺度迁移学习方法, 能有效解决模型漂移问题, 实现模型对污水处理系统动态演化的跟随响应.
关键词: 多层感知机神经网络(MLP)模型      机制模型      迁移学习      模型漂移      系统适应性      知识迁移     
Drift Correction Method of Wastewater Treatment Model Based on Transfer Learning Across Time Scales
SHEN Yu1,2 , LIAO Wan-shan1 , LI Hui-min1,3 , FENG Dong4 , GUO Zhi-wei1,2 , ZHANG Bing1,2 , GAO Xu1,4 , WANG Jian-hui1,2 , CHEN You-peng3     
1. Chongqing Key Laboratory of Intelligent Perception and Blockchain Technology, National Research Base of Intelligent Manufacturing Service, School of Artificial Intelligence, Chongqing Technology and Business University, Chongqing 400067, China;
2. Chongqing South-to-Thais Environmental Protection Technology Research Institute Co., Ltd., Chongqing 400069, China;
3. College of Environment and Ecology, Chongqing University, Chongqing 400045, China;
4. Chongqing Sino French Environmental Excellence R & D Centre, Chongqing 400010, China
Abstract: Data is the core foundation of intelligent operation and maintenance, but currently, there is generally insufficient data for wastewater treatment plants, and the status of wastewater treatment systems dynamically evolves with the changes in the internal and external environment. The intelligent operation and maintenance of wastewater plants face difficulties in modeling and model drift caused by system evolution. In response to this issue, the summer and winter seasons with significant differences in wastewater temperature, wastewater quality, and microbial status were selected as typical comparison scenarios. The mechanism model was combined with neural networks to establish a wastewater treatment model drift correction method based on cross-time scale transfer learning. Firstly, in response to the problem of insufficient data, an activated sludge model (ASM) was established and calibrated. Summer operating data was used as input to simulate and calculate operating parameters and effluent data, generating a simulated operating dataset to achieve data augmentation and quality improvement. This was used to train a multi-layer perceptron neural network (MLP) model. The results showed that the average simulation accuracy of the MLP model for summer effluent COD, ammonia nitrogen, total phosphorus, etc., was all over 95%. This indicates the feasibility of training MLP models based on ASM-generated data. Then, the MLP model was used to guide the operation of the pilot A2O project. Experimental data analysis showed that the model drift phenomenon was significant in the field of wastewater treatment. During the operation of the pilot plant guided by the summer model, the accuracy of the predicted values gradually decreased, and the average prediction accuracy of the model for effluent COD gradually decreased from 98.14% to 75.18%. The phenomenon of model drift required effective correction to maximize the effectiveness of the model. In response to the problem of model drift caused by a significant decrease in simulation accuracy in winter operating conditions, a transfer learning approach was introduced. The winter measured data was used as the target domain dataset, and the MLP model was used as the pre-trained model for transfer learning. The experimental results showed that transfer learning methods can significantly improve model performance. After transfer learning, the average simulation accuracy of the MLP model for effluent COD, ammonia nitrogen, total nitrogen, and total phosphorus was relatively improved by 28.58%, 184.44%, 207.56%, and 100.51%, with absolute improvement values of 21.49%, 60.79%, 58.14%, and 46.74%, respectively. This indicates that the cross-time scale transfer learning method proposed in this study can significantly improve model performance, effectively solve model drift problems, and achieve a model-following response to the dynamic evolution of wastewater treatment systems. This study indicates that transfer learning based on pre-trained models only requires a small amount of engineering data and computational complexity to achieve model updating and correction. Compared to model retraining, this method reduces computational complexity and reduces the dependence on engineering data during data-driven model updates.
Key words: multi-layer perceptron neural network (MLP) model      mechanism model      transfer learning      model drift      system adaptability      knowledge transfer     

在“双碳”战略背景下, 城市污水厂智慧升级是污水行业低碳高质量发展的重大需求. 污水处理系统是一个多变量、非线性、强耦合的复杂系统, 传统的污水处理运维模式高度依赖人工经验, 存在粗放、保守的操作方式, 如过量曝气和过度投药, 导致大量能耗和物耗浪费[1, 2]. 随着人工智能和物联网等技术的发展和在多个领域复杂场景中的应用, 基于数据和模型的高效、精准运维模式成为污水厂转型升级的重要趋势, 也成为近年来的研究热点[3, 4].

污水厂智能运维的核心是模型, 基础是数据. 然而当前污水处理领域的现状是, 污水处理厂因时间、成本、技术或维护等原因, 往往无法收集大量完整的过程数据, 无法为构建智能运维模型提供足够的数据支持[5, 6]. 同时, 污水处理系统的核心是生物处理单元, 微生物状态随内外部环境的变化而发生演化, 这导致模型随时间推移而逐渐漂移失准[7, 8]. 因此, 污水厂的智能运维一方面面临着建模难度大的问题, 另一方面还面临着因系统演化而导致的模型漂移问题[9].

在污水处理领域, 智能运维模型根据其工作原理和透明性可分为机制模型和数据模型. 以活性污泥模型(ASM)为代表的机制模型, 能根据生化反应机制和物质流传递过程建立精确数学模型, 对污水处理过程数据依赖较少[10, 11]. 但模型需要率定的关键动力学参数测量复杂, 且因为污水处理系统的动态演化, 导致率定参数的有效期短, 因此在实际工程中, ASM模型多是用在新工艺开发、问题查找和设计模拟等离线模拟场景, 而很少有污水厂智能运维的成功案例[12 ~ 14]. 以神经网络为代表的数据模型是一种从数据中挖掘规律, 建立从输入到输出数据映射关系的有效方法, 具备训练简单和容错性好等优点, 同时能够规避复杂的生化反应过程和工艺结构[15, 16]. 同时, 由于它不受限于系统场景, 模型更新方便, 具备模型进化潜力, 有望应对污水处理系统的动态演化, 因而成为污水处理领域的研究重点[17, 18]. 对比两类模型的优缺点可知, 机制模型对工程数据需求少, 且能模拟并生成大量数据, 能够解决工程数据不足的问题, 但难以应对污水系统给的动态演化问题;数据模型具备模型进化潜力, 能够应对对象系统的演化, 但需要大量数据的支持[19, 20]. 采用机制模型和数据模型相结合的思路, 可以整合两者的优势, 解决前述两个问题.

在现有的研究中, 常规的模型进化方法通常是根据新数据、新场景需求来重新构建并训练模型, 但这一过程训练较为复杂, 且对新数据的数量和质量要求较高[21]. 迁移学习是解决机器学习领域目标场景中数据短缺的重要方法[22]. 数据量大且蕴含知识量丰富的场景被称为源域, 数据量少且蕴含知识匮乏的场景被称为目标域[23]. 依据源域与目标域之间的相似性, 迁移学习的主要步骤是:首先利用数据模型从源域数据中提取知识、挖掘规律, 训练好的模型被称为预训练模型;然后将预训练模型应用于目标域, 以目标域的少量数据对预训练模型的部分参数进行更新[24, 25]. 迁移学习的思想在诸多领域有所研究和应用, 利用从源域学到的可转移知识来提高模型在目标域的泛化性能. Vinodhini等[26]提出卷积神经网络(CNN)和迁移学习方法预测沥青道路的坑洼, 用于提醒驾驶员注意和通知部门及时维修. Li等[27]使用新隧道中的数据训练机器学习并利用迁移学习, 实现隧道掘进机响应预测和塌方预警. Chen等[28]基于LSTM的迁移学习模型, 以实验室电池老化数据作为源数据, 电动汽车电池(EVB)老化数据为目标数据, 很好地预测了EVB老化数据, 为EVB老化分析提出了新的思路. Wan等[29]提出了一种基于迁移学习的极限学习机, 在学习可转换的跨域特征的同时尽可能保持源域的性质和结构, 从而对齐从涡扇发动机采集的数据分布差异. Zhang等[30]使用传统深度学习模型深度后向传播神经网络预测非均质含水层的地下水流量, 并基于迁移学习方法改进模型在复杂场景下的应用. Wang等[31]提出了一种基于对抗的深度迁移学习方案, 以解决微电网数据驱动故障检测和隔离中故障标签数据不足的问题. Lei等[32]回顾了机器学习在故障诊断中的应用, 指出基于迁移学习的智能故障诊断方法具有从学术研究到工程实践的广阔应用前景. 综合来看, 迁移学习具备跨场景知识共享和复用的优势, 而同一系统在不同时段的状态, 可视为关联性更强的场景, 故迁移学习方案能够实现跨时间的知识迁移. 但当前在污水处理领域, 迁移学习相关研究尚鲜见报道.

因此, 本研究提出了一种基于跨时间尺度迁移学习的污水处理模型漂移校正方法, 该方法首先通过ASM机制模型的模拟计算, 解决污水处理厂数据不足、不全等数据问题, 然后通过神经网络模型提取数据中蕴含的知识和规律, 用于指导污水处理工程运行;进而, 在发生模型漂移后, 通过少量工程数据对原神经网络模型的部分参数进行更新校准, 通过跨时间尺度的迁移学习实现模型漂移校正.

1 材料与方法 1.1 实验装置

本研究使用的实验装置为一体化A2O中试装置, 由污水处理系统、在线监测系统和在线控制系统组成, 在重庆市某大型污水处理厂内运行, 进水取自污水厂初沉池后, 日处理量15 t. 中试装置与该污水厂同工艺、同水源、同环境且同步运行.

1.2 ASM模型模拟

根据前述中试装置的工艺结构和尺寸, 利用WEST软件平台搭建ASM 2D模型, 并按照通用方法测定关键生化反应动力学参数, 进行模型率定校准[33, 34]. 然后分析污水处理厂进水水质参数范围, 基于中试装置所在的大型污水厂2017~2020年这4 a夏季进水数据, 统计其进水水质并设置各类水质指标梯度, 形成覆盖所有进水条件90%以上的典型进水水质组合. 将这些典型进水参数输入到校准好的ASM 2D模型中, 在满足出水水质达标的前提下, 以能耗、药耗综合成本最低为目标, 不断优化曝气量、加药量和回流比等中间控制参数, 逐条计算得到运行参数和出水数据, 生成典型工况的模拟运行数据集.

由该大型污水厂2017~2020年夏季进水数据, 得到进水水质各分段权重, 各段区间内数据量在总数据集中的百分比, 如图 1所示. 进水ρ[化学需氧量(COD)]在180~700 mg·L-1的占95.57%, 进水ρ[氨氮(NH4+-N)]在17~40 mg·L-1的占87.33%, 进水ρ[总磷(TP)]在2.7~9.0 mg·L-1的占91.56%, 进水ρ[总氮(TN)]在30~65 mg·L-1的占93%. 根据各分段所占权重不同, 对进水水质进行了不同步长梯度的划分, 以进一步细化进水工况. 进水ρ(COD)在300~500 mg·L-1段占比超过20%, 步长设置为25 mg·L-1, 其余步长为40 mg·L-1. 进水ρ(NH4+-N)在20~35 mg·L-1段占比较高, 均超过18%, 步长设置为1.5 mg·L-1, 其余段步长3 mg·L-1. 进水TP浓度步长设置以权重为19%为界, 当权重值大于19%时, 步长设置为0.5 mg·L-1, 当权重值小于19%时, 步长设置为0.7 mg·L-1或0.6 mg·L-1. 最后, 通过排布组合, 生成模拟运行数据库进水工况. 此外, 根据污水厂4 a历史数据中碳氮比(C/N)和碳磷比(C/P)的实际范围, 剔除不符合实际情况的工况组合, 得到模拟运行污水厂的典型进水工况集.

百分数为各水质区间在总数据集中的数量占比 图 1 污水处理厂进水水质分段权重 Fig. 1 Fractional weight of inlet water quality of wastewater treatment plant

1.3 多层感知机神经网络模型

感知器模型是最早和最经典的人工神经网络, 是所有人工神经网络的基础[35]. 1985年, Hinton提出的多层感知机器(MLP)模型, 比单层感知机拥有更强的拟合能力, 可以处理非线性问题和高维数据, 并具有较好的泛化能力[36, 37], 故本研究选择MLP模型来模拟污水处理系统. MLP模型结构如图 2所示, 包括一个输入层、一个或多个隐藏层和一个输出层, 除了输入节点, 每个节点都带有非线性激活函数. 本研究构建了MLP模型:1号MLP模型具有3层隐藏层, 前两层隐藏层含有20个隐藏节点, 第3层含有10个隐藏节点;2号MLP模型具有4层隐藏层, 隐藏节点分别为:20、40、20和1. 构建完成后将它们“组装”在一起, 使用梯度下降法确定模拟的最佳参数, 将模拟运行数据库70%的数据作为训练集, 30%的数据作为测试集, 激活函数采用ReLU函数;通过多次对比尝试将学习率设定为0.001, 训练次数设定为1 000次. 模型效果评价采用平均绝对误差(MAE)、均方根误差(RMSE)和平均绝对百分比误差(MAPE).

图 2 MLP模型结构 Fig. 2 Structure diagram of MLP model

1.4 模型迁移学习方法

迁移学习是一种利用预训练模型在不同的任务和领域之间进行知识迁移的机器学习技术. 与传统机器学习方法不同, 迁移学习不仅仅能够针对特定任务进行特征学习, 还能将学习到的知识应用到其他任务中[38]. 这种知识迁移可以通过预训练模型的部分参数调整来实现, 也可以在预训练模型基础上增加新网络层等方式来实现[39]. 迁移学习的工作原理是利用已有的标注数据, 提取和学习复杂的特征、规律, 并将其应用于新场景中, 减少目标场景下对数据和计算量的需求[40, 41]. 迁移学习可用于解决数据不平衡、样本稀疏等问题, 提高模型的泛化能力和性能[42, 43]. 在实际应用中, 迁移学习主要包括4类实现方法:基于样本的迁移学习、基于特征的迁移学习、基于模型的迁移学习和基于关系的迁移学习[44, 45], 结合污水处理过程和跨场景迁移学习的需求分析, 基于模型的迁移学习是最为适用的.

基于模型的迁移学习是指从源域和目标域中找到共享参数信息, 利用源域和目标域的参数共享模型[46]. 这种迁移方式的假设条件是:源域中的数据与目标域中的数据可以共享一些模型的参数, 即源域和目标域服从某些共性的规律. 针对污水处理场景, 本文研究的对象是同一系统不同时段的状态, 其工艺结构和规模不变, 且遵循固定的生化反应规律, 夏季污水处理运行过程和冬季污水处理运行过程遵循相同的生化反应原理, 参与反应的微生物和反应物没有本质上的区别, 只是生化反应动力学参数存在差异. 源域和目标域运行模型的相关权重大部分可以使用相同的参数, 只需要对其中部分参数进行修正即可. 因此所搭建的预训练模型结构可以直接迁移适用, 故选用基于模型的迁移学习方法进行研究. 在预训练模型中, 神经网络较浅层提取到的特征更为普适, 而较深层提取到的特征则更具针对性. 模型微调技术是通过保留、迁移较浅层的权重, 并重新训练较深层的权重来实现知识的迁移和转化. 因此, 本研究选择基于具体模型的迁移学习方法, 具体采取微调技术实现迁移学习, 在污水处理场景中其应用策略与流程如图 3所示.

图 3 迁移学习策略与流程 Fig. 3 Transfer learning strategy and process

迁移学习的实现步骤如下:①模型预训练, 以源域数据训练MLP模型, 并保存模型网络结构和参数, 训练好的模型被称为预训练模型. 本研究中, 源域数据是指ASM模型模拟夏季工况生成的模拟运行数据库. ②迁移学习, 采用基于微调技术的迁移学习策略, 将预训练模型的输入层、部分隐藏层参数冻结, 采用目标域数据重新训练预训练模型. 冻结的参数在重新训练中不会被更新, 未被冻结的隐藏层和输出层参数将被更新, 从而使得模型适应目标域数据间的映射关系. 本研究中, 目标域数据是指污水处理系统在冬季运行的实测数据. ③模型验证, 将目标域测试集数据输入迁移学习后得到的新模型, 分析模型性能, 根据效果决定是否跳转回步骤②, 重新进行迁移学习.

2 结果与讨论 2.1 污水处理模拟数据集

根据权重比设定典型进水水质工况, 设定NH4+-N、COD和TP典型工况分别为14、17和12条. 将其排列组合并去除明显不符合实际工况的数据, 最终得到2 134条典型进水水质工况. 将2 135条典型进水水质工况作为输入运行ASM模型, 得到2 134典型出水水质工况, 每条出水水质工况包括出水COD、NH4+-N、TN和TP. 将典型进水水质工况和典型出水水质工况结合成模拟运行数据库, 其包括2 134条模拟运行数据, 每条模拟运行数据包括进水水质(NH4+-N、COD和TP)和出水水质(COD、NH4+-N、TN和TP)共计7个要素.

2.2 基于模拟数据的迁移学习

基于模拟运行数据集训练MLP模型, 训练后模型在测试集上的模拟效果如图 4所示. 所有模拟指标的平均准确率均在90%左右, 其中, 出水COD、出水NH4+-N、出水TN和曝气量的平均准确率在95%以上. 所有指标中平均准确率最小的是排泥量(88.95%), 最大的是出水COD(98.14%). 整体而言, 基于模拟数据集训练的MLP模型在测试集上表现良好.

图 4 MLP模型在测试集的模拟效果 Fig. 4 Simulation effect of MLP model in the test set

2.3 污水处理工程模型漂移分析

污水处理系统的核心是生物处理单元, 其内部的微生物系统状态随内外部环境的变化而动态演化, 这将导致模型因未能同步更新而逐步失真, 即出现模型漂移现象. 本研究选取夏季和冬季作为研究的时间尺度, 因为随着季节的变化, 气温和居民用水模式等发生变化, 导致这两个时间段污水厂的水温、水质和微生物状态等都有显著区别. 在本研究中, 用夏季数据训练的MLP模型指导冬季污水处理, 实验时间为2022年11月(30 d), 每6 h选取一组实时数据, 共120组数据, 检验模型跨时间指导运行能力.

以MLP模型指导污水处理运行的出水水质与模型预测的出水水质存在越来越大的偏差, 其中出水NH4+-N和TN的实测值均比预测值高, 出水指标中预测效果最好的COD, 平均准确率仅为75.18%. 运行结果表明, 模型在用于指导实际污水处理时发生了模型漂移, 即旧的模型随着时间的改变, 在最新工程运行数据下模拟的效果发生了偏差. 以具有代表性的COD指标为例, MLP模型指导效果随时间的变化如图 5所示, 直观地展示了模型漂移现象, 模型对出水COD的平均预测准确率从98.14%逐步降低到了75.18%.

平均预测准确率:夏季为98.14%, 冬季为75.18%(发生模型漂移) 图 5 MLP模型指导下出水COD浓度随时间的变化 Fig. 5 Changes in effluent COD concentration over time under the guidance of MLP model

2.4 跨时间尺度模型迁移学习

针对模型在冬季工况中出现模拟准确率大幅下降等模型漂移问题, 将冬季实测数据作为目标域数据集, 以MLP模型作为预训练模型进行迁移学习. 采用微调策略进行迁移学习后的MLP模型在训练集和测试集的误差分析如表 1所示. 结果显示, 在训练集上, MAE和RMSE值最大的参数是曝气量, 分别为4.314 4 m3·d-1和5.395 3 m3·d-1;MAE和RMSE值最小的参数是排泥量, 分别为0.003 4 m3·d-1和0.004 2 m3·d-1;MAPE值最大的参数是污泥回流量, 为0.022 5;MAPE值最小的参数是曝气量, 为0.002 0. 在测试集上, 曝气量的MAPE最小(0.005 2), 模拟效果最最佳;出水COD的MAPE最大(0.038 5). 在训练集和测试集上, 所有参数的MAPE值均小于0.05, 这表明经过迁移学习后, MLP模型在训练集和测试集上都有良好的模拟性能.

表 1 迁移学习后模型在训练集和测试集的误差分析1) Table 1 Error analysis of the model in the training set and test set after transfer learning

将迁移学习后的MLP模型应用于一体化A2O中试装置, 指导污水处理, 连续运行30 d, 每天取4组数据, 验证迁移学习的效果. 用MAPE值来评估模型迁移前后对污水处理的指导效果, 图 6直观地展示了迁移学习前后模型模拟4个主要指标的MAPE值箱型图. 从图 6中可以清晰地看到, 迁移学习后4个主要出水指标的MAPE平均值比迁移学习前显著降低.

红色线条表示MAPE的平均值, 绿色横线表示MAPE的最大值和最小值 图 6 迁移前后的MAPE值 Fig. 6 MAPE value of MLP model before and after transfer learning

迁移学习前后, 4个主要出水指标模拟准确度的对比如表 2所示, 以相对提升和绝对提升两个指标来表征模型在迁移学习前后的效果. 相对提升值是迁移学习后的平均模拟准确率减去迁移学习前的平均模拟准确率, 再除以迁移学习前的平均模拟准确率;绝对提升值是迁移学习后的平均模拟准确率减去迁移学习前的平均模拟准确率. 出水COD、NH4+-N、TN和TP的平均模拟准确率相对提升效果为28.58%、184.44%、207.56%和100.51%, 绝对提升效果分别为21.49%、60.79%、58.14%和46.74%. 实验结果表明, 迁移学习后模型性能显著提升, 本研究提出的跨时间尺度迁移学习方法, 能有效解决模型漂移问题, 实现模型对污水处理系统动态演化的跟随响应.

表 2 迁移学习前后模型模拟效果对比 Table 2 Comparison of model effects before and after transfer learning

夏季模型能有效地迁移至冬季场景, 从原理角度分析:模型发生漂移是因为水温、水质及微生物生态等内外部环境发生了变化, 但污水处理系统内的底层生化反应原理相同, 具备相似性, 所以可以基于夏季模型作为预训练模型, 利用少量冬季运行数据进行模型迁移学习, 将夏季模型参数更新, 高效适配于冬季工况, 从而解决夏季模型在冬季发生的模型漂移问题. 同理, 夏季模型也可以通过迁移学习的方法适配到春季、秋季或其他时间段的场景中, 实现模型的动态更新和跟随响应. 该方法需要基于在线监测数据流的反馈实现模型更新, 而污水处理系统内外部环境的差异大小决定了运行数据的变化, 这将影响该方法对模型漂移校正的效果.

与传统的以新数据训练新模型相比, 以迁移学习方法进行模型校正, 有很大的优越性. 迁移学习以预训练模型为基础, 仅对部分参数进行微调, 需要的实测数据更少, 参数校准的时间更短. 本研究中MLP模型进行迁移学习的迭代次数为100次, 而训练一个新的MLP模型迭代次数约为1 000次. 因此, 本研究提出的方法不仅可以减少计算量, 还可以减少模型对工程数据的依赖. 图 7直观地展示了模型应用、模型漂移以及模型校准这3个阶段的COD预测值和实测值, 从中可以看到迁移学习后, 模型模拟精度比迁移前更高, 模拟误差波动幅度比迁移前更小, 模拟稳定性显著提升, 模型跨时间尺度的漂移得到有效校正.

平均预测准确率:夏季为98.14%, 冬季为75.18%(发生模型漂移), 冬季迁移学习后为96.67% 图 7 MLP模型应用、漂移以及校准3个阶段的COD预测值和实测值 Fig. 7 COD predicted and measured values in three stages of MLP model application, drift, and calibration

3 结论

(1)模型漂移现象在污水处理领域表现显著. 研究建立的夏季模型在指导中试装置运行过程中, 预测值准确度逐渐下降, 模型对出水COD的平均预测准确率从98.14%逐步降低到了75.18%. 因此, 在模型应用中, 漂移现象需要及时发现和校正, 才能有效地适用于污水厂运行指导.

(2)迁移学习方法能够显著提升模型性能. MLP模型经迁移学习后, 对出水COD、NH4+-N、TN和TP的平均模拟准确率相对提升效果为28.58%、184.44%、207.56%和100.51%, 绝对提升效果分别为21.49%、60.79%、58.14%和46.74%, 这表明本研究提出的跨时间尺度迁移学习方法, 能够有效更新模型参数, 显著提升模型性能.

(3)迁移学习方法可以有效解决污水处理模型漂移的校正问题. 基于预训练模型的迁移学习, 仅需要少量工程数据和较少的计算量即可实现模型的更新校正. 相比于模型重新训练的传统思路, 研究所提出的方法不仅减少了计算量, 也减少了数据驱动模型更新时对工程数据的依赖. 通过迁移学习方法可以实现模型动态更新, 进而实现对污水处理系统状态的跟随响应, 在污水厂运行管理领域具备较大的应用潜力.

致谢: 重庆耐德自动化技术有限公司为本研究的中试装置提供在线监测仪表系统, 重庆中法唐家沱污水处理有限公司为中试装置的运行和维护提供场地、水电及技术支持, 在此一并致谢.

参考文献
[1] 胡鹤轩, 孙昕远. 人工智能技术在模拟预测和优化污水处理中的应用[J]. 环境污染与防治, 2023, 45(11): 1587-1590, 1602.
Hu H X, Sun X Y. Application of artificial intelligence technology in simulation, prediction and optimization of wastewater treatment[J]. Environmental Pollution & Control, 2023, 45(11): 1587-1590, 1602.
[2] Zhao L, Dai T J, Qiao Z, et al. Application of artificial intelligence to wastewater treatment: A bibliometric analysis and systematic review of technology, economy, management, and wastewater reuse[J]. Process Safety and Environmental Protection, 2020, 133: 169-182. DOI:10.1016/j.psep.2019.11.014
[3] Wang Y Q, Wang H C, Song Y P, et al. Machine learning framework for intelligent aeration control in wastewater treatment plants: Automatic feature engineering based on variation sliding layer[J]. Water Research, 2023, 246. DOI:10.1016/j.watres.2023.120676
[4] Naha A, Antony S, Nath S, et al. A hypothetical model of multi-layered cost-effective wastewater treatment plant integrating microbial fuel cell and nanofiltration technology: A comprehensive review on wastewater treatment and sustainable remediation[J]. Environmental Pollution, 2023, 323. DOI:10.1016/j.envpol.2023.121274
[5] Sanaye S, Yazdani M. Energy, exergy, economic and environmental analysis of a running integrated anaerobic digester-combined heat and power system in a municipal wastewater treatment plant[J]. Energy Reports, 2022, 8: 9724-9741. DOI:10.1016/j.egyr.2022.07.155
[6] Stadler C, Fusé V S, Linares S, et al. Estimation of methane emission from an urban wastewater treatment plant applying inverse Gaussian model[J]. Environmental Monitoring and Assessment, 2021, 194(1). DOI:10.1007/s10661-021-09660-4
[7] 黄德才, 李远威, 郝凯越, 等. 高原温度条件对A2O工艺污水处理效果影响研究[J]. 水处理技术, 2021, 47(11): 106-110.
Huang D C, Li Y W, Hao K Y, et al. Research on the effect of plateau temperature on sewage treatment effect of anaerobic-anoxic-oxic process[J]. Technology of Water Treatment, 2021, 47(11): 106-110.
[8] Fan X Y, Gao J F, Pan K L, et al. Temporal heterogeneity and temperature response of active ammonia-oxidizing microorganisms in winter in full-scale wastewater treatment plants[J]. Chemical Engineering Journal, 2019, 360: 1542-1552. DOI:10.1016/j.cej.2018.10.234
[9] 操家顺, 叶添, 徐润泽. 市政污水生化处理过程中曝气控制系统研究进展[J]. 水处理技术, 2024, 50(2): 7-13.
Cao J S, Ye T, Xu R Z. Research progress on aeration control system in municipal wastewater biochemical treatment process[J]. Technology of Water Treatment, 2024, 50(2): 7-13.
[10] 于怀星, 袁丁, 何梓灏. 短程精准曝气智能控制系统在污水处理厂中的应用[J]. 环境工程, 2023, 41(11): 165-171.
Yu H X, Yuan D, He Z H. Application of short-range precision aeration and intelligent control system in sewage treatment plant[J]. Environmental Engineering, 2023, 41(11): 165-171.
[11] Simon-Várhelyi M, Cristea V M, Luca A V. Reducing energy costs of the wastewater treatment plant by improved scheduling of the periodic influent load[J]. Journal of Environmental Management, 2020, 262. DOI:10.1016/j.jenvman.2020.110294
[12] Minnie J, Gaszynski C, Basitere M, et al. Modelling filamentous bacteria in activated sludge systems and the advancements of secondary settling tank models: A review[J]. Biochemical Engineering Journal, 2022, 186. DOI:10.1016/j.bej.2022.108598
[13] Vilela P, Safder U, Heo S K, et al. Dynamic calibration of process-wide partial-nitritation modeling with airlift granular for nitrogen removal in a full-scale wastewater treatment plant[J]. Chemosphere, 2022, 305. DOI:10.1016/j.chemosphere.2022.135411
[14] Borzooei S, Amerlinck Y, Panepinto D, et al. Energy optimization of a wastewater treatment plant based on energy audit data: small investment with high return[J]. Environmental Science and Pollution Research, 2020, 27(15): 17972-17985. DOI:10.1007/s11356-020-08277-3
[15] Ba-Alawi A H, Al-Masni M A, Yoo C K. Simultaneous sensor fault diagnosis and reconstruction for intelligent monitoring in wastewater treatment plants: An explainable deep multi-task learning model[J]. Journal of Water Process Engineering, 2023, 55. DOI:10.1016/j.jwpe.2023.104119
[16] Ba-Alawi A H, Loy-Benitez J, Kim S Y, et al. Missing data imputation and sensor self-validation towards a sustainable operation of wastewater treatment plants via deep variational residual autoencoders[J]. Chemosphere, 2022, 288. DOI:10.1016/j.chemosphere.2021.132647
[17] Hejabi N, Saghebian S M, Aalami M T, et al. Evaluation of the effluent quality parameters of wastewater treatment plant based on uncertainty analysis and post-processing approaches (case study)[J]. Water Science & Technology, 2021, 83(7): 1633-1648.
[18] Dai T J, Su Z G, Zeng Y F, et al. Wastewater treatment plant effluent discharge decreases bacterial community diversity and network complexity in urbanized coastal sediment[J]. Environmental Pollution, 2023, 322. DOI:10.1016/j.envpol.2023.121122
[19] Cangialosi F, Bruno E, De Santis G. Application of machine learning for fenceline monitoring of odor classes and concentrations at a wastewater treatment plant[J]. Sensors (Basel), 2021, 21(14). DOI:10.3390/s21144716
[20] Starling M C V M, de Mendonça Neto R P, Pires G F F, et al. Combat of antimicrobial resistance in municipal wastewater treatment plant effluent via solar advanced oxidation processes: Achievements and perspectives[J]. Science of the Total Environment, 2021, 786. DOI:10.1016/j.scitotenv.2021.147448
[21] 袁健. 基于OpenBIM赋能全地下污水厂数字孪生建设[J]. 中国给水排水, 2024, 40(2): 70-74.
Yuan J. Digital twin construction of underground sewage treatment plant assisted by OpenBIM[J]. China Water & Wastewater, 2024, 40(2): 70-74.
[22] Theodoris C V, Xiao L, Chopra A, et al. Transfer learning enables predictions in network biology[J]. Nature, 2023, 618(7965): 616-624. DOI:10.1038/s41586-023-06139-9
[23] Lu H M, Wu J Z, Ruan Y J, et al. A multi-source transfer learning model based on LSTM and domain adaptation for building energy prediction[J]. International Journal of Electrical Power & Energy Systems, 2023, 149. DOI:10.1016/j.ijepes.2023.109024
[24] Ardalan Z, Subbian V. Transfer learning approaches for neuroimaging analysis: A scoping review[J]. Frontiers in Artificial Intelligence, 2022, 5. DOI:10.3389/frai.2022.780405
[25] Pisa I, Morell A, Vilanova R, et al. Transfer learning in wastewater treatment plant control design: From conventional to long short-term memory-based controllers[J]. Sensors (Basel), 2021, 21(18). DOI:10.3390/s21186315
[26] Vinodhini K A, Sidhaarth K R A. Pothole detection in bituminous road using CNN with transfer learning[J]. Measurement: Sensors, 2024, 31. DOI:10.1016/j.measen.2023.100940
[27] Li J H, Guo D, Chen Z Y, et al. Transfer learning for collapse warning in TBM tunneling using databases in China[J]. Computers and Geotechnics, 2024, 166. DOI:10.1016/j.compgeo.2023.105968
[28] Chen J G, Han X B, Sun T, et al. Analysis and prediction of battery aging modes based on transfer learning[J]. Applied Energy, 2024, 356. DOI:10.1016/j.apenergy.2023.122330
[29] Wan S K, Liu J Y, Li X H, et al. Transfer-learning-based bearing fault diagnosis between different machines: A multi-level adaptation network based on layered decoding and attention mechanism[J]. Measurement, 2022, 203. DOI:10.1016/j.measurement.2022.111996
[30] Zhang J W, Liang X Y, Zeng L Z, et al. Deep transfer learning for groundwater flow in heterogeneous aquifers using a simple analytical model[J]. Journal of Hydrology, 2023, 626. DOI:10.1016/j.jhydrol.2023.130293
[31] Wang T, Zhang C Y, Hao Z G, et al. Data-driven fault detection and isolation in DC microgrids without prior fault data: A transfer learning approach[J]. Applied Energy, 2023, 336. DOI:10.1016/j.apenergy.2023.120708
[32] Lei Y G, Yang B, Jiang X W, et al. Applications of machine learning to machine fault diagnosis: A review and roadmap[J]. Mechanical Systems and Signal Processing, 2020, 138. DOI:10.1016/j.ymssp.2019.106587
[33] Demi̇r S, Atçı E B. Sensitivity analysis and principal component analysis for the determination of the most influential kinetic parameters in activated sludge modeling[J]. Journal of Environmental Chemical Engineering, 2021, 9(5). DOI:10.1016/j.jece.2021.105872
[34] Khatri N, Singh M, Pokhriyal S, et al. Computational fluid dynamics modelling of primary sludge classification in an activated sludge process based wastewater treatment plant: Simulating the hydrodynamic behaviour and experimental verification of the classification efficiency[J]. Chemical Engineering Journal, 2023, 464. DOI:10.1016/j.cej.2023.142475
[35] Song L, Yu W, Tan Y S, et al. Calculations of fractional derivative option pricing models based on neural network[J]. Journal of Computational and Applied Mathematics, 2024, 437. DOI:10.1016/j.cam.2023.115462
[36] Zhang M J, Wen G H, Zhong J H, et al. Multi-label recognition of facial body constitution via MLP-like deep networks with non-equilibrium weight loss[J]. Biomedical Signal Processing and Control, 2024, 87. DOI:10.1016/j.bspc.2023.105363
[37] Gholizadeh M, Saeedi R, Bagheri A, et al. Machine learning-based prediction of effluent total suspended solids in a wastewater treatment plant using different feature selection approaches: A comparative study[J]. Environmental Research, 2024, 246. DOI:10.1016/j.envres.2024.118146
[38] Yu Z X, Shen D, Jin Z M, et al. Progressive transfer learning[J]. IEEE Transactions on Image Processing, 2022, 31: 1340-1348. DOI:10.1109/TIP.2022.3141258
[39] Ekinci E, Özbay B, Omurca S İ, et al. Application of machine learning algorithms and feature selection methods for better prediction of sludge production in a real advanced biological wastewater treatment plant[J]. Journal of Environmental Management, 2023, 348. DOI:10.1016/j.jenvman.2023.119448
[40] Wang L H, Sun Y F, Zhang X D. Quantum adversarial transfer learning[J]. Entropy (Basel), 2023, 25(7). DOI:10.3390/e25071090
[41] Bashiri F S, Caskey J R, Mayampurath A, et al. Identifying infected patients using semi-supervised and transfer learning[J]. Journal of the American Medical Informatics Association, 2022, 29(10): 1696-1704. DOI:10.1093/jamia/ocac109
[42] Ahmed I B, Ouarda W, Amar C B. Enhanced computer-aided diagnosis model on ultrasound images through transfer learning and data augmentation techniques for an accurate breast tumors classification[J]. Procedia Computer Science, 2023, 225: 3938-3947. DOI:10.1016/j.procs.2023.10.389
[43] Zoetmulder R, Gavves E, Caan M, et al. Domain- and task-specific transfer learning for medical segmentation tasks[J]. Computer Methods and Programs in Biomedicine, 2022, 214. DOI:10.1016/j.cmpb.2021.106539
[44] Xiao L, Xue X Y, Wang N, et al. A transfer learning-based approach to fatigue life prediction of corroded bimetallic steel bars using small samples[J]. Construction and Building Materials, 2023, 400. DOI:10.1016/j.conbuildmat.2023.132679
[45] Ruan Y J, Liu M R, Meng H, et al. Predictive model of pump energy consumption based on image feature extraction and instance-based transfer learning[J]. Journal of Building Engineering, 2023, 79. DOI:10.1016/j.jobe.2023.107770
[46] Luo A N, Feng Y J, Zhu C Y, et al. Transfer learning for modeling plasmonic nanowire waveguides[J]. Nanomaterials (Basel), 2022, 12(20). DOI:10.3390/nano12203624