基于神经网络和数值模型的重点区域PM<sub>2.5</sub>预报比较分析

引用本文

高愈霄, 汪巍, 黄永海, 王晓彦, 朱媛媛, 朱莉莉, 许荣, 李健军. 基于神经网络和数值模型的重点区域PM_2.5预报比较分析[J]. 环境科学, 2022, 43(2): 663-674.

GAO Yu-xiao, WANG Wei, HUANG Yong-hai, WANG Xiao-yan, ZHU Yuan-yuan, ZHU Li-li, XU Rong, LI Jian-jun. Comparison and Analysis of PM_2.5 Forecast in Key Areas Based on the Neural Network Model and Numerical Model[J]. Environmental Science, 2022, 43(2): 663-674.

基于神经网络和数值模型的重点区域PM_2.5预报比较分析

高愈霄, 汪巍, 黄永海, 王晓彦, 朱媛媛, 朱莉莉, 许荣, 李健军

中国环境监测总站, 北京 100012

收稿日期: 2021-05-07; 修订日期: 2021-07-11

基金项目: 国家重点研发计划项目（2017YFC0213004）；国家自然科学基金项目（41875164）

作者简介: 高愈霄(1986~), 男, 硕士, 高级工程师, 主要研究方向为空气质量预测预报, E-mail: gaoyx@cnemc.cn

通信作者: 许荣，E-mail: xurong@cnemc.cn

摘要: 应用BP神经网络法建立京津冀及周边城市、汾渭平原、苏皖鲁豫交界地区和长三角地区等重点区域95个城市PM_2.5预报模型，对2020年秋冬季上述地区城市开展未来7 d的PM_2.5预测预报，并对比同期业务化运行的数值模型预报结果和各城市人工订正后预报结果，对3方法预报效果进行分析评估.结果表明：①4区域神经网络法模型性能短期预报相对较好，中长期有所降低，对4区域均有一定的系统性高估，苏皖鲁豫交界地区系统性偏差最小，长三角地区偏差最显著.数值模型区域预报水平较神经网络有所降低，各评价指标总体低于神经网络，对辖区城市间预报效果较神经网络差异更大.②神经网络、数值模型和人工订正方法对4区域PM_2.5浓度预报准确率普遍较低，平均不足50%，准确水平总体呈：神经网络>人工订正>数值模型.3方法分指数级别范围准确率均大幅提升，4区域1~4 d平均准确率均在65%以上，神经网络模型和人工订正水平相近，总体高于数值模型.③在预报中度及以上污染级别日时，数值模型在京津冀及周边城市、苏皖鲁豫交界地区和长三角地区效果均较为理想，汾渭平原最差.神经网络模型对京津冀及周边城市、苏皖鲁豫交界地区和汾渭平原短期预报效果较好，长三角地区较差.人工订正结果总体在中度污染级别时预报效果相对较好，重度及以上预报效果和神经网络模型相近.

关键词: BP神经网络 NAQPMS模型人工订正重点区域 PM_2.5预报比较分析

Comparison and Analysis of PM_2.5 Forecast in Key Areas Based on the Neural Network Model and Numerical Model

GAO Yu-xiao , WANG Wei , HUANG Yong-hai , WANG Xiao-yan , ZHU Yuan-yuan , ZHU Li-li , XU Rong , LI Jian-jun

China National Environmental Monitoring Centre, Beijing 100012, China

Abstract: The PM_2.5 forecast models of 95 cities in Beijing-Tianjin-Hebei and its surrounding cities (BTH); the Fenwei Plain (FWP); the border area of Jiangsu, Anhui, Shandong, and Henan (JASH); and the Yangtze River Delta (YRD) regions were established using BP neural network models, and the forecast was carried out for the next seven days in the autumn and winter in 2020. By comparing the forecast results of the BP neural network models, numerical model, and artificial correction, the PM_2.5 forecast effects of the three methods were analyzed and evaluated. The results showed: ① The performance of the short-term forecast based on the BP neural network was relatively good but was reduced in the medium and long term and systematically overestimated in four regions. The numerical model effects were lower than those of the BP neural network models. ② The accuracy rates of the PM_2.5 forecast concentration by the three methods were generally low in the four regions, with an average of less than 50%, and the accuracy values in order from high to low were the BP neural network models, artificial correction, and the numerical model. The accuracy rates of IAQI levels of PM_2.5 were significantly improved by the three methods, and the averages were above 65% in the first four days. The effects of the BP neural network models and artificial correction were similar, which were generally higher than those of the numerical model. ③ The numerical model had good effects in the BTH, JASH, and YRD regions, whereas it was the worst when forecasting moderately and above-polluted days in the FWP region. The BP neural network model had a good performance when forecasting short-term PM_2.5 in the BTH, JASH, and FWP regions, whereas it was poor in the YRD region. In general, the performance of artificial correction was relatively good when forecasting moderate-level days and was close to the BP neural network model when forecasting heavily polluted days.

Key words: BP neural network NAQPMS model artificial correction key regions PM_2.5 forecast comparative analysis

自《大气污染防治行动计划》和《打赢蓝天保卫战行动计划》实施以来, 全国各省市纷纷采取行之有效的方法, 着重强化以PM_2.5为首的大气污染防治工作, 并于2017年圆满完成“大气十条”既定目标.但是, 以京津冀及周边“2+26”城市(京津冀及周边城市)、汾渭平原、苏皖鲁豫交界地区和长三角地区为代表的重点区域污染水平仍然较重, PM_2.5浓度仍处于高位, 区域污染过程时有发生^[1~3].空气质量预报能够提前预判大气污染变化, 是妥善应对重污染天气的重要技术手段, 对改善空气质量, 指导区域大气污染联防联控有效开展具有重要意义.

PM_2.5预报所依靠的模型根据结果产生过程可分为机制模型和非机制模型, 分别以数值模型和逐步兴起的机器学习模型为代表.近年来, 以该两种方法开展PM_2.5预报模拟的研究成果不断丰富, 在我国区域和城市得到较好应用.数值预报方面, 王自发等^[4]的研究建立了嵌套网格NAQPMS模型, 在京津冀及周边^[5], 长三角^[6]、珠三角^[7]和其他重点城市和地区^[8]得到较好应用.以WRF-Chem模型或结合卫星资料等方法预报我国中东部地区^{[9, 10]}, 以及应用CMAQ模型或结合天气分型等方法对珠三角^[11]、西安^[12]、上海^[13]和中国台湾地区^[14]PM_2.5预报模拟效果均较为理想.针对机器学习方法, 运用随机森林^[15]、梯度提升回归^[16]、决策树回归^[17]、长短期记忆^[18]和卷积网络^[19]等多种模型, 以及将数值模型和神经网络相结合开展PM_2.5预报^[20]都取得了较好效果.与其他机器学习方法相比, BP神经网络在非线性映射能力、学习和自适应能力、容错能力等方面有独到优势, 作为目前应用最为广泛神经网络形式, 在PM_2.5预报方面应用较多^[21~25].

同样看到, 虽然以神经网络和数值模型开展PM_2.5预报的成果较多, 但多数研究主要针对单个城市或单一区域, 在预报时效上主要关注邻近小时预报或短期预报(1~3 d), 而对于更大范围区域城市的预报方法适用性、数值模型和神经网络模型更长时间跨度(1~7 d)的预报效果比较, 以及与现阶段预报员人工订正后的预报结果比较分析研究较少.

因此, 本文应用传统BP神经网络法建立京津冀及周边城市、汾渭平原、苏皖鲁豫交界地区和长三角地区95个城市PM_2.5预报模型, 对2020年秋冬季(2020年9月至2021年2月)上述城市1~7 d的PM_2.5开展预报预测, 并对比同期业务化运行的数值模型预报结果和各城市预报员订正后的人工预报结果, 对3种方法的预报效果进行分析评估, 通过全面了解重点地区和城市神经网络方法、数值模型应用效果, 以及相应地区预报员总体预报水平, 提升PM_2.5预报能力, 以期为打赢污染防治攻坚战做出积极作用.

1 材料与方法 1.1 数据来源

研究区域为我国4个重点区域, 包括京津冀及周边28城市, 汾渭平原11城市、苏皖鲁豫交界地区22城市和长三角地区41城市.区域城市分布见文献[26].

空气质量监测数据来源中国环境监测总站空气质量发布数据, 包括上述地区城市和监测点位(372个站点)2018年1月1日至2021年2月28日PM_2.5小时和日均浓度.模型训练和预报所需气象数据来源美国国家环境预报中心NCEP(National Centers for Environmental Prediction)的GFS(Global Forecast System)全球气象预报系统同期0.25°×0.25°预报数据, 时间分辨率3 h. 监测点位分布和气象网格示意见图 1.人工预报PM_2.5日均浓度来源上述城市每日经预报员订正后预报结果.

图 1 监测点位分布和气象网格示意 Fig. 1 Map of positions of national monitoring sites and meteorological grid

1.2 模型构建和参数选择

BP神经网络模型设置: 根据前期研究并参考文献[27~30], PM_2.5气象影响因子主要包括边界层高度、风速、气温、湿度和气压等.因此, 从GFS诸多气象参数中初步选取2 m温度, 2 m相对湿度, 10 m纬向和经向风速, 地面降水, 边界层高度, 1 000 hPa处温度与975、950、925、900和850 hPa的差值及地面气压等参数作为模型备选因子.同时, 除气象参数外, 还将前1d的PM_2.5和当天早间(00:00~09:00)PM_2.5监测数据作为因子加入模型.

对不同城市站点, 以PM_2.5与对应格点气象参数相关性大小进一步筛选气象因子.针对各城市的所选站点、各预测天合计建立最多7个涵盖上述不同参数搭配的预报模型进行学习训练.以某城市A、B站点为例, 将上述各气象因子和对应PM_2.5做相关分析, 前1 d的PM_2.5浓度、当天早间PM_2.5浓度、2 m气温、边界层高度、地面气压和750 hPa逆温强度等参数在A、B站点与PM_2.5相关性均较强, 作为拟建立多模型的共有因子; 10 m纬向和经向风速、湿度等参数在不同站点或不同预报天相关性有所差异, 作为附加因子.两站点以共有因子和附加因子为基础, 搭配形成包括不同因子的多种模型(如模型1~模型4), 随后根据模型评价验证指标^[31]和不同模型在验证阶段的不同表现, 择优选择1个模型作为该站点未来某预测天最终模型开展预报, A和B站点最终模型选取示意见表 1.城市预报结果为各站点预报均值.

表 1 A和B监测点位未来7 d模型选择示意¹⁾ Table 1 Choice of models in the next seven days in site A and B

相关研究显示^[32], 单隐含层的神经网络即可完成任意m维到n维的映射, 因此本研究网络隐含层数为1层.隐含层节点数通过经验公式^[33]以及比较预测结果与观测值的均方根误差大小共同确定.经计算, 不同城市站点网络模型节点数在4~8个时误差最小.平均训练次数约100次.建模数据为2018年1月1日至2020年8月31日数据, 其中70%用于训练, 30%验证, 每次结果重复计算5次取平均值.模型建立应用Matlab程序.BP神经网络预报模型构建示意见图 2.

图 2 BP神经网络预报模型构建示意 Fig. 2 Diagram of BP forecast model

数值模型基本设置: 数值模型采用NAQPMS空气质量数值模型, 具体参数设置见参考文献[34].

1.3 评价方法

预报效果评估采用平均误差(ME)、标准化平均偏差(NMB)、均方根误差(RMSE)和相关系数(R)等统计指标, ME值越小说明预测值和实测值越接近, NMB和RMSE绝对值越小说明效果越好, R越大且接近1, 表示相关性越高, 说明预测值越接近于实测值, 计算方法见参考文献[35].

同时, 参考空气质量评估规定等文件^[36], 对PM_2.5的浓度和分指数级别预报准确率进行评价.若城市当日PM_2.5浓度落入对应预报浓度范围内, 认为浓度范围预报准确; 若城市当日PM_2.5浓度折算空气质量分指数级别落入预报对应分指数级别范围内, 认为级别范围预报准确.

2 结果与讨论 2.1 BP神经网络、数值模型和人工订正结果比较分析 2.1.1 BP神经网络和数值模型对比

BP神经网络对京津冀及周边城市、汾渭平原、苏皖鲁豫交界地区和长三角地区PM_2.5日均浓度预报评价指标箱式图显示(图 3), 总体而言, 4区域短期预报(1~3 d)模型性能相对较好, 中长期(4~7 d)有所降低.

图 3 4区域BP神经网络模型24~168 h PM_2.5预报结果评估 Fig. 3 Evaluation of 24- 168 h PM_2.5 forecasting results by BP neural network model in four regions

4区域1~7 d预报结果与监测实况总体偏差相对较小, ME均值在19~31 μg·m^-3之间, RMSE特点和ME一致, 均为京津冀及周边城市偏差最大, 长三角地区偏差最小, 区域均值在23~43 μg·m^-3之间.NMB总体呈系统性正向偏差, 均值为9%~18%, 显示总体有一定的系统性高估, 苏皖鲁豫交界地区系统性偏差最小, 长三角地区偏差最显著.京津冀及周边城市、汾渭平原和苏皖鲁豫交界地区R平均水平较为接近, 短期R效果明显优于长三角地区, 1~2 d均值较长三角地区提高0.1.

对于短期预报, 京津冀及周边城市、汾渭平原和苏皖鲁豫交界地区各项指标预报效果总体相近, ME、RMSE和R较大, NMB较小, 浓度偏差相对较大, 但系统性偏差较小.长三角地区预报效果和其他地区差异明显, ME、RMSE和R总体相比均较低, NMB略大, 这也和长三角地区较其他地区PM_2.5浓度总体较低有一定关系.同时, 区域四分位距大小显示, 京津冀及周边城市4项评价指标分布最为集中, 对辖区各城市预报效果总体相近, 苏皖鲁豫交界地区、汾渭平原和长三角地区逐步分散, 辖区城市间预报效果差异逐步增大.

4区域R、RMSE和ME随预报时间延长效果明显下降, 预报结果和监测实况相关性逐步减弱, 预报偏差总体升高, NMB变化相对较小, 系统性偏差变化幅度不大.综合各项评价指标显示, 4区域1~3 d预报结果和监测实况相关性较强, 预报效果相对较好, 但模型评价指标下降最为明显, 平均降幅约9%, 表明模型对第2 d起的预报结果有相当程度降低.对第4 d及以上预报结果, 多项评价指标较差, 预报性能持续降低.此外, 长三角地区评价指标随预报时间延长变化幅度相对较小, 预报稳定性总体较好, 其他地区变化幅度较大, 长期预报稳定相对较差.

神经网络法在不同区域产生上述差异, 除城市PM_2.5污染水平不同外, 主要源自城市所选气象参数对当地PM_2.5影响强弱不同.气象特征因子和PM_2.5相关性越大, 在网络中对PM_2.5的解释能力越强, 网络学习效果越好, 模型预报效果总体更好.因此, 如何有效提取特征因子, 筛选、优化神经网络模型气象输入参数, 还有待进一步研究.

为详细评估模型单个城市预报效果, 选取北京、石家庄、郑州、济南、青岛、洛阳、西安、临汾、上海和杭州这10城市作为不同区域代表城市.结果显示, 代表城市24、72和120 h的PM_2.5预报效果和区域总体变化特征基本一致(表 2), 上海和西安ME和NMB偏差较大, 反映模型对该地区城市有一定的系统性高估.其他城市偏差相对较小, 预报效果相对较好.各城市预报效果随预报时间延长逐步降低, 半数城市120 h预报R不足0.50.

表 2 代表城市BP神经网络模型24、72和120 h PM_2.5预报结果评估 Table 2 Evaluation of 24, 72, and 120 h PM_2.5 forecasting results by the BP neural network model in representative cities

城市	监测值/μg·m^-3	24 h			72 h			120 h
城市	监测值/μg·m^-3	ME/μg·m^-3	R	NMB/%	ME/μg·m^-3	R	NMB/%	ME/μg·m^-3	R	NMB/%
北京	39	15.36	0.78	-5	19.64	0.63	2	23.93	0.45	5
石家庄	62	20.98	0.78	6	30.79	0.54	14	33.06	0.47	17
郑州	63	23.11	0.71	4	26.17	0.61	5	27.78	0.58	8
济南	58	21.92	0.71	13	27.41	0.56	17	30.91	0.46	14
青岛	38	17.89	0.63	7	19.03	0.54	6	19.99	0.52	3
洛阳	64	18.84	0.76	-4	24.62	0.58	-6	26.64	0.55	-2
西安	62	23.18	0.82	24	30.28	0.61	26	32.36	0.54	25
临汾	62	15.53	0.81	-10	20.51	0.64	-6	25.77	0.49	-5
上海	31	21.93	0.62	48	22.36	0.49	49	23.55	0.46	50
杭州	36	12.80	0.59	5	13.80	0.55	6	14.61	0.52	10

数值模型对4区域1~7d预报结果与神经网络模型相似, 但对于不同区域和城市, 两种模型预报效果有所差异.

数值模型1~7 d预报箱式图(图 4)和神经网络与数值模型24、72和120 h模型评价指标城市差异分布(数值模型和神经网络对应指标之差)显示(图 5), 数值模型在京津冀及周边城市NMB较神经网络偏差略大, 短期预报偏差幅度较神经网络增大近1倍, ME和RMSE基本一致, R平均水平略好, 在预报结果和监测实况相关程度以及随预报延长的衰减程度总体优于神经网络模型.北京和石家庄等代表城市ME和NMB均大于神经网络, 预报结果和监测实况相差较大, 效果较差; 汾渭平原数值模型总体逊于神经网络模型, RMSE、ME升高较明显, 但NMB偏差较小.不同城市预报效果差异较大, 对临汾预报较好, 系统性偏差相对较小, 对西安预报偏差和系统性偏离程度较神经网络有较大差距; 苏皖鲁豫交界地区方法差异相对较小, ME、RMSE总体接近, NMB总体略差于神经网络模型, 青岛两种方法总体表现相差不大, 数值模型R相对更高, 但NMB随预报时间延长变化较神经网络模型偏离较大; 长三角地区预报偏差总体高于神经网络, ME、RMSE平均水平较神经网络模型总体变差约50%, 随预报延长系统性偏离程度相较更大.上海和杭州等代表城市表现有所差异, 数值模型对上海偏差较低, 24 h预报结果和监测实况相关程度相比显著提升, 对杭州预报偏差相对较大, 系统性高估程度较高.

图 4 4区域数值模型24~168 h PM_2.5预报结果评估 Fig. 4 Evaluation of 24- 168 h PM_2.5 forecasting results by numerical model in four regions

图 5 4区域BP神经网络模型和数值模型24、72和120 h预报评价指标差异 Fig. 5 Differences in PM_2.5 forecasting results evaluation of 24, 72, and 120 h between the BP neural network model and numerical model in four regions

箱式图还显示, 除长三角地区NMB指标外, 数值模型对其他区域和评价指标集中度总体均弱于BP神经网络, 极值偏差范围总体较大, 反映数值模型较神经网络相比对辖区城市间预报效果差异更大.总体而言, 神经网络模型在4区域预报偏差总体小于数值模型, 随预报延长的变差幅度也相比较小, 总体效果更好.

2.1.2 PM_2.5浓度范围和级别范围准确率 2.1.2.1 浓度范围准确率

4区域神经网络、数值模型和人工订正方法1~7 d的PM_2.5浓度范围预报准确率显示(图 6), 总体而言, 神经网络模型对4区域各城市预报准确率普遍较低, 平均为33%. 未准确预报时段, 偏高显著, 平均偏高率为46%.数值模型准确率总体低于神经网络, 京津冀及周边城市、汾渭平原、苏皖鲁豫交界地区和长三角地区平均准确率分别较神经网络偏低3%、10%、6%和5%. 人工订正结果在京津冀及周边城市、汾渭平原和长三角地区准确率水平较神经网络分别降低2%、4%和1%, 苏皖鲁豫交界地区基本持平, 但总体高于数值模型.

图 6 4区域BP神经网络、数值模型和人工订正24~168 h PM_2.5浓度范围准确率 Fig. 6 Accuracy rates of 24- 168 h PM_2.5 concentration by BP neural network, numerical model, and artificial correction in four regions

数值模型四分位距平均最小, 人工订正相对较大, 反映数值模型对各城市预报准确率水平总体接近, 而各城市人工订正结果水平差异相对较大.

2.1.2.2 级别范围准确率

与浓度范围准确率相比, 3方法分指数级别范围准确率均大幅提升, 4区域1~4 d平均准确率均在65%以上(图 7).神经网络模型平均准确率达68%, 数值模型级别准确率较神经网络法相比总体小幅下降2%, 不同地区有所差异, 在京津冀及周边城市和汾渭平原, 1~2天邻近预报下降幅度略大, 平均降低3%, 长三角地区基本持平, 苏皖鲁豫交界地区提高2%.人工订正结果较神经网络法相比, 在京津冀及周边城市、苏皖鲁豫交界地区和长三角地区24 h预报效果有所下降, 降低幅度在2%~8%之间, 汾渭平原上升3%, 与数值模型相比, 人工订正在长三角地区平均降低3%, 其他地区总体提升1%~9%. 3方法的预报级别准确率随预报时间延长变化特点和浓度范围准确率特点一致, 总体均呈下降趋势, 神经网络模型下降幅度和人工订正相似, 总体较数值模型降幅略小.

图 7 4区域BP神经网络、数值模型和人工订正24~168 h PM_2.5级别范围准确率 Fig. 7 Accuracy rates of 24- 168 h PM_2.5 IAQI level by the BP neural network, numerical model and artificial correction in four regions

四分位距特点和浓度预报基本一致, 同样呈现数值模型城市预报差异较小, 人工订正较大趋势.但神经网络长三角地区四分位距明显偏大, 反映其在各城市间预报效果差异更为突出.

代表城市24、72和120 h的PM_2.5预报结果显示(表 3), 神经网络法各城市级别预报准确率均超过50%.数值模型准确率水平较神经网络相比普遍下降, 和浓度准确率特点相似, 北京、洛阳、西安和杭州等城市降低幅度较大, 24 h预报平均准确率下降14%, 上海提高20%.人工订正结果较神经网络相比, 各城市预报效果差异较大, 在石家庄、济南、青岛、临汾和杭州的准确率较低, 平均降低10%, 其中对临汾降幅最大约为21%.对北京、郑州、洛阳、西安和上海等城市平均上升9%, 西安提升最多约为24%.

表 3 代表城市在3方法下24、72和120 h预报PM_2.5级别范围准确率 Table 3 Accuracy rates of 24, 72, and 120 h PM_2.5 IAQI level by three methods in representative cities

城市	监测值/μg·m^-3	24 h预报准确率/%			72 h预报准确率/%			120 h预报准确率/%
城市	监测值/μg·m^-3	数值模型	人工订正	神经网络	数值模型	人工订正	神经网络	数值模型	人工订正	神经网络
北京	39	67	82	80	58	79	72	54	74	69
石家庄	62	68	72	76	59	68	58	63	70	58
郑州	63	71	82	75	68	76	71	63	75	68
济南	58	72	67	76	63	66	61	60	62	60
青岛	38	81	72	82	73	75	79	74	71	74
洛阳	64	68	84	79	64	80	72	69	78	65
西安	62	49	90	66	50	81	54	50	74	53
临汾	62	77	64	86	66	69	75	64	67	66
上海	31	86	74	66	74	67	68	72	63	61
杭州	36	72	79	88	69	74	87	69	73	81

表 3 代表城市在3方法下24、72和120 h预报PM_2.5级别范围准确率 Table 3 Accuracy rates of 24, 72, and 120 h PM_2.5 IAQI level by three methods in representative cities

区域和代表城市浓度和级别准确率还显示, 个别区域和城市存在浓度范围和级别范围准确率不一致的情况, 如郑州数值模型24 h浓度准确率较神经网络方法更高, 但级别准确率相比更低, 主要在于相应城市虽然浓度范围准确率较高, 但未预报准确时的偏差幅度更大, 跨级偏差次数更多, 因而级别准确率更低.

2.1.3 中度及以上污染日预报效果

2020年9月~2021年2月京津冀及周边城市、汾渭平原、苏皖鲁豫交界地区和长三角地区中度及以上污染城市累计天数分别为544、181、360和212 d, 占比分别为11%、9%、9%和3%.其中以PM_2.5为首要污染物天数占比分别为86%、88%、91%和83%, 秋冬季节4区域PM_2.5污染形势仍不容忽视.为此, 统计4区域首要污染物为PM_2.5时中度及以上污染日相关信息, 评估24、72和120 h污染期间预报效果.

3方法的中度及以上级别预报准确率显示, 神经网络模型在京津冀及周边城市、汾渭平原和苏皖鲁豫交界地区中度污染级别和重至严重污染级别预报准确率总体相近, 3区域24 h平均准确率约为67%, 汾渭平原预报准确率最高, 中度及以上污染级别准确率均超过70%[图 8(a)].长三角地区准确率水平最低, 中度和重至严重污染级别准确率分别为41%和20%. 4区域在未准确预报时段, 准确率总体以偏低为主, 24 h平均偏低率为41%.

图 8 4区域BP神经网络、数值模型和人工订正24、72和120 h PM_2.5中度及以上污染级别准确率 Fig. 8 Accuracy rates of 24, 72, and 120 h moderate and above PM_2.5 IAQI levels by the BP neural network, numerical model and artificial correction in four regions

数值模型和人工订正结果较神经网络模型相比, 对不同区域、不同级别均有较大差异.数值模型较神经网络模型相比, 在京津冀及周边城市和长三角地区中度污染级别日预报准确率有所提高, 长三角地区提高明显, 24 h准确率上升29%.在汾渭平原和苏皖鲁豫交界地区预报准确率均有下降, 汾渭平原24 h降幅最大为34%.对于重至严重污染级别日, 数值模型在汾渭平原预报水平较神经网络法下降显著, 24 h准确率下降达51%, 京津冀及周边城市略有下降, 苏皖鲁豫交界地区和长三角地区提升明显, 24 h准确率分别提高29%和63%[图 8(b)].

人工订正结果较神经网络模型相比, 在京津冀及周边城市和长三角地区中度污染级别准确率有所提高, 24 h提高幅度分别为17%和9%.在汾渭平原和苏皖鲁豫交界地区预报准确率略有下降, 24 h分别降低4%和2%.对于重至严重污染级别日, 京津冀及周边城市、汾渭平原和苏皖鲁豫交界地区预报水平较神经网络下降较为显著, 24 h准确率分别降低22%、38%和14%, 在长三角地区略有提升, 平均提高5%[图 8(c)].

总体而言, 在预报中度及以上污染级别日时, 数值模型在京津冀及周边城市、苏皖鲁豫交界地区和长三角地区效果均较为理想, 随预报时间延长偏差较小, 但汾渭平原较差.神经网络模型对京津冀及周边城市、苏皖鲁豫交界地区和汾渭平原短期预报效果较好, 长三角地区较差.人工订正结果总体在中度污染级别时预报效果相对较好, 重度及以上预报效果和神经网络模型相近.

代表城市3方法的中度污染和重至严重污染级别日预报准确率显示, 在不同城市、不同级别均有较大差异(图 9).BP神经网络模型对北京、石家庄、郑州、济南和西安等城市24 h效果相对较好, 准确率总体在50%以上, 对洛阳、青岛和上海预报效果相对较差, 青岛和上海重度污染未能报出.随预报时间延长, 神经网络模型对多数城市预报准确率下降幅度较数值模型和人工订正明显, 对中长期预报效果较差, 北京、石家庄、济南下降幅度最大.数值模型除西安、临汾预报效果略差外, 对其他城市预报准确率相比总体较高, 随预报时间延长降幅相对较小.人工订正结果和神经网络结果相似, 对个别城市中长期重度污染级别预报偏差较大.

图 9 代表城市3方法下24、72和120 h PM_2.5中度及以上污染级别准确率 Fig. 9 Accuracy rates of 24, 72, and 120 h moderate and above PM_2.5 IAQI levels by three methods in representative cities

同样看到, 对青岛和上海等城市预报偏差原因除预报模型性能偏差外, 污染日数样本较少也是重要原因(青岛和上海中度及以上污染天数分别为5d和2d), 当中度及以上污染日数较少时, 少数预报偏差对全时段预报准确率造成较大影响.

2.2 预报偏差讨论

数值模型受源排放清单、模型化学机制、气象初始与边界条件等多因素影响, 在预报过程中有累加偏差和不确定性^[37~42], 如近几年污染减排力度较大和环保督查工作的持续开展, 重点地区各类污染排放源大幅减少, 而模型所需的排放清单难以及时更新, 是预报结果普遍高估的重要原因.

BP神经网络模型偏差主要取决于建模时所选因子(如气象预报资料)的准确性和模型核心算法的精准性, 并同样难以避免受污染源排放变化影响.受算法限制, BP神经网络存在自身局部极小化、训练过拟合和最优网络结构难确定等局限, 预测精确程度有待进一步提高^[43], 预报所需的GFS气温、湿度和风速等参数也有不同程度的偏差^[44~46].同数值模型相比, BP神经网络模型预报过程输入数据不确定性影响因素相对较少, 累计偏差相对较低, 可能也是预报效果总体较好的原因之一.

人工订正结果是在各区域和城市模型结果基础上, 预报员结合实际情况综合分析研判、会商形成, 很大程度受到模型偏差的影响.同时, 由于各区域城市气象条件、地形特征、污染源排放差异, PM_2.5污染特征变化不尽相同, 准确预报的难易程度区别较大, 加之各地预报部门受人员、技术等条件限制, 最终预报水平有所差异.

此外, 在重污染来临之前, 各级人民政府都会根据环境空气质量预报结果发布相应级别的重污染预警, 采取临时减排限排措施^[47], 都会导致污染排放量显著下降, 这也是3种方法预报结果普遍偏高的重要原因.

3 结论

(1) BP神经网络对4区域1~7 d预报结果体现了与监测实况较好的变化趋势, 短期预报(1~3 d)性能相对较好, 中长期(4~7 d)有所降低.对京津冀及周边城市预报效果总体相近, 苏皖鲁豫交界地区、汾渭平原和长三角地区各城市间差异较大.数值模型预报水平较神经网络有所降低, 各评价指标总体低于神经网络, 对辖区城市间预报效果较神经网络差异更大.

(2) 神经网络、数值模型和人工订正方法对4区域PM_2.5浓度预报准确率普遍较低, 平均不足50%, 准确水平总体呈神经网络＞人工订正＞数值模型, 预报偏高明显. 3方法分指数级别范围准确率均大幅提升, 4区域1~4 d平均准确率均在65%以上, 神经网络模型和人工订正水平相近, 总体高于数值模型.

(3) 在预报PM_2.5中度及以上污染级别日时, 数值模型在京津冀及周边城市、苏皖鲁豫交界地区和长三角地区效果较为理想, 汾渭平原最差.神经网络模型对京津冀及周边城市、苏皖鲁豫交界地区和汾渭平原短期预报效果较好, 长三角地区较差.人工订正结果总体在中度污染级别时预报效果相对较好, 重度及以上预报效果和神经网络模型相近.

致谢: 感谢北京立博威拓环境技术有限公司王淑莹工程师和中科三清科技有限公司郑辉辉及赵耀工程师对本研究的支持, 在此一并致谢！

参考文献

[1]	王韵杰, 张少君, 郝吉明. 中国大气污染治理: 进展·挑战·路径[J]. 环境科学研究, 2019, 32(10): 1755-1762. Wang Y J, Zhang S J, Hao J M. Air pollution control in China: progress, challenges and future pathways[J]. Research of Environmental Sciences, 2019, 32(10): 1755-1762.
[2]	刘晟东, 史君楠, 程勇, 等. 中国典型城市群PM_2.5污染特征研究进展[J]. 环境科学研究, 2020, 33(2): 243-251. Liu S D, Shi J N, Cheng Y, et al. Review of pollution characteristics of PM_2.5 in Chinese representative megacities[J]. Research of Environmental Sciences, 2020, 33(2): 243-251.
[3]	Feng Y Y, Ning M, Lei Y, et al. Defending blue sky in China: Effectiveness of the "air pollution prevention and control action plan" on air quality improvements from 2013 to 2017[J]. Journal of Environmental Management, 2019, 252. DOI:10.1016/j.jenvman.2019.109603
[4]	王自发, 谢付莹, 王喜全, 等. 嵌套网格空气质量预报模式系统的发展与应用[J]. 大气科学, 2006, 30(5): 778-790. Wang Z F, Xie F Y, Wang X Q, et al. Development and application of nested air quality prediction modeling system[J]. Chinese Journal of Atmospheric Sciences, 2006, 30(5): 778-790. DOI:10.3878/j.issn.1006-9895.2006.05.07
[5]	潘锦秀. 京津冀大气重污染过程数值预报与评估[D]. 南京: 南京信息工程大学, 2016. Pan J X. The numerical forecast and evaluation for heavy air pollution in Beijing-Tianjin-Hebei[D]. Nanjing: Nanjing University of Information Science and Technology, 2016.
[6]	朱莉莉, 晏平仲, 王自发, 等. 江苏省级区域空气质量数值预报模式效果评估[J]. 中国环境监测, 2015, 31(2): 17-23. Zhu L L, Yan P Z, Wang Z F, et al. An operational evaluation of the regional air quality forecast modeling system in Jiangsu[J]. Environmental Monitoring in China, 2015, 31(2): 17-23. DOI:10.3969/j.issn.1002-6002.2015.02.004
[7]	蒋争明, 徐迅宇, 陈吟晖, 等. 空气质量多模式预报系统在中山市的应用[J]. 中国环境监测, 2018, 34(4): 34-43. Jiang Z M, Xu X Y, Chen Y H, et al. Application of air quality multi-model forecasting system in Zhongshan[J]. Environmental Monitoring in China, 2018, 34(4): 34-43.
[8]	Wang Y L, Chen H S, Wu Q Z, et al. Three-year, 5 km resolution China PM_2.5 simulation: model performance evaluation[J]. Atmospheric Research, 2018, 207: 1-13. DOI:10.1016/j.atmosres.2018.02.016
[9]	Zhou G Q, Xu J M, Xie Y, et al. Numerical air quality forecasting over eastern China: an operational application of WRF-Chem[J]. Atmospheric Environment, 2017, 153: 94-108. DOI:10.1016/j.atmosenv.2017.01.020
[10]	Hong J, Mao F Y, Min Q L, et al. Improved PM_2.5 predictions of WRF-Chem via the integration of Himawari-8 satellite data and ground observations[J]. Environmental Pollution, 2020, 263. DOI:10.1016/j.envpol.2020.114451
[11]	谢敏, 钟流举, 陈焕盛, 等. CMAQ模式及其修正预报在珠三角区域的应用检验[J]. 环境科学与技术, 2012, 35(2): 96-101. Xie M, Zhong L J, Chen H S, et al. Application and verification of CMAQ model and revision forecast in Pearl River Delta region[J]. Environmental Science & Technology, 2012, 35(2): 96-101. DOI:10.3969/j.issn.1003-6504.2012.02.020
[12]	Yang X C, Wu Q Z, Zhao R, et al. New method for evaluating winter air quality: PM_2.5 assessment using Community Multi-Scale Air Quality Modeling (CMAQ) in Xi'an[J]. Atmospheric Environment, 2019, 211: 18-28. DOI:10.1016/j.atmosenv.2019.04.019
[13]	王茜, 吴剑斌, 林燕芬. CMAQ模式及其修正技术在上海市PM_2.5预报中的应用检验[J]. 环境科学学报, 2015, 35(6): 1651-1656. Wang Q, Wu J B, Lin Y F. Implementation of a dynamic linear regression method on the CMAQ forecast of PM_2.5 in Shanghai[J]. Acta Scientiae Circumstantiae, 2015, 35(6): 1651-1656.
[14]	Cheng F Y, Feng C Y, Yang Z M, et al. Evaluation of real-time PM_2.5 forecasts with the WRF-CMAQ modeling system and weather-pattern-dependent bias-adjusted PM_2.5 forecasts in Taiwan[J]. Atmospheric Environment, 2021, 244. DOI:10.1016/j.atmosenv.2020.117909
[15]	康俊锋, 黄烈星, 张春艳, 等. 多机器学习模型下逐小时PM_2.5预测及对比分析[J]. 中国环境科学, 2020, 40(5): 1895-1905. Kang J F, Huang L X, Zhang C Y, et al. Hourly PM_2.5 prediction and its comparative analysis under multi-machine learning model[J]. China Environmental Science, 2020, 40(5): 1895-1905. DOI:10.3969/j.issn.1000-6923.2020.05.005
[16]	Doreswamy H K S, Yogesh K M, Gad I, et al. Forecasting air pollution particulate matter (PM_2.5) using machine learning regression models[J]. Procedia Computer Science, 2020, 171: 2057-2066. DOI:10.1016/j.procs.2020.04.221
[17]	Xu X D, Tong T, Zhang W, et al. Fine-grained prediction of PM_2.5 concentration based on multisource data and deep learning[J]. Atmospheric Pollution Research, 2020, 11(10): 1728-1737. DOI:10.1016/j.apr.2020.06.032
[18]	Chang Y S, Chiao H T, Abimannan S, et al. An LSTM-based aggregated model for air pollution forecasting[J]. Atmospheric Pollution Research, 2020, 11(8): 1451-1463. DOI:10.1016/j.apr.2020.05.015
[19]	Kow P Y, Wang Y S, Zhou Y L, et al. Seamless integration of convolutional and back-propagation neural networks for regional multi-step-ahead PM_2.5 forecasting[J]. Journal of Cleaner Production, 2020, 261. DOI:10.1016/j.jclepro.2020.121285
[20]	Sayeed A, Lops Y, Choi Y, et al. Bias correcting and extending the PM forecast by CMAQ up to 7 days using deep convolutional neural networks[J]. Atmospheric Environment, 2021, 253. DOI:10.1016/j.atmosenv.2021.118376
[21]	张恒德, 张庭玉, 李涛, 等. 基于BP神经网络的污染物浓度多模式集成预报[J]. 中国环境科学, 2018, 38(4): 1243-1256. Zhang H D, Zhang T Y, Li T, et al. Forecast of air quality pollutants' concentrations based on BP neural network multi-model ensemble method[J]. China Environmental Science, 2018, 38(4): 1243-1256.
[22]	Lightstone S D, Moshary F, Gross B. Comparing CMAQ forecasts with a neural network forecast model for PM_2.5 in New York[J]. Atmosphere, 2017, 8(9). DOI:10.3390/atmos8090161
[23]	Liu H, Yan G X, Duan Z, et al. Intelligent modeling strategies for forecasting air quality time series: a review[J]. Applied Soft Computing, 2021, 102. DOI:10.1016/j.asoc.2020.106957
[24]	Cabaneros S M, Calautit J K, Hughes B R. A review of artificial neural network models for ambient air pollution prediction[J]. Environmental Modelling & Software, 2019, 119: 285-304.
[25]	Wang W J, Yang S Q. Analysis and forecast of urban air quality based on BP neural network[J]. International Journal of Advanced Network, Monitoring and Controls, 2020, 5(3): 57-64. DOI:10.21307/ijanmc-2020-028
[26]	中华人民共和国生态环境部. 关于印发《2020年挥发性有机物治理攻坚方案》的通知(环大气[2020] 33号)[EB/OL]. http://www.mee.gov.cn/xxgk2018/xxgk/xxgk03/202006/t20200624_785827.html, 2021-06-24.
[27]	Hooyberghs J, Mensink C, Dumont G, et al. A neural network forecast for daily average PM₁₀ concentrations in Belgium[J]. Atmospheric Environment, 2005, 39(18): 3279-3289. DOI:10.1016/j.atmosenv.2005.01.050
[28]	夏晓圣, 陈菁菁, 王佳佳, 等. 基于随机森林模型的中国PM_2.5浓度影响因素分析[J]. 环境科学, 2020, 41(5): 2057-2065. Xia X S, Chen J J, Wang J J, et al. PM_2.5 concentration influencing factors in China based on the random forest model[J]. Environmental Science, 2020, 41(5): 2057-2065.
[29]	苗蕾, 廖晓农, 王迎春. 基于长时间序列的北京PM_2.5浓度日变化及气象条件影响分析[J]. 环境科学, 2016, 37(8): 2836-2846. Miao L, Liao X N, Wang Y C. Diurnal variation of PM_2.5 mass concentration in Beijing and influence of meteorological factors based on long term date[J]. Environmental Science, 2016, 37(8): 2836-2846.
[30]	颜丰华, 陈伟华, 常鸣, 等. 珠江三角洲大气光化学氧化剂(O_x)与PM_2.5复合超标污染特征及气象影响因素[J]. 环境科学, 2021, 42(4): 1600-1614. Yan F H, Chen W H, Chang M, et al. Characteristics and meteorological factors of complex nonattainment pollution of atmospheric photochemical oxidant (O_x) and PM_2.5 in the Pearl River Delta Region, China[J]. Environmental Science, 2021, 42(4): 1600-1614.
[31]	王淑莹, 许纯领, 尹翠芳, 等. OPAQ系统两种模式对O₃预报准确率的探讨[J]. 环境监控与预警, 2020, 12(2): 13-16. Wang S Y, Xu C L, Yin C F, et al. Discussion on the accuracy of O₃ prediction by two modules of OPAQ system[J]. Environmental Monitoring and Forewarning, 2020, 12(2): 13-16. DOI:10.3969/j.issn.1674-6732.2020.02.003
[32]	朱苹, 王成刚, 冯妍, 等. 合肥市冬季PM_2.5统计预报方法初试与比较研究[J]. 环境科学与技术, 2019, 42(12): 81-89. Zhu P, Wang C G, Feng Y, et al. A preliminary and comparative study of PM_2.5 statistical forecasting in Hefei City during winter[J]. Environmental Science & Technology, 2019, 42(12): 81-89.
[33]	陈明. MATLAB神经网络原理与实例精解[M]. 北京: 清华大学出版社, 2013.
[34]	朱莉莉, 汪巍, 张稳定, 等. 2018年11月上旬一次中韩PM_2.5相互影响传输过程分析[J]. 中国环境监测, 2021, 37(1): 69-75. Zhu L L, Wang W, Zhang W D, et al. Analysis of the transmission process of PM_2.5 interaction between China and South Korea in early November 2018[J]. Environmental Monitoring in China, 2021, 37(1): 69-75.
[35]	中国环境监测总站. 环境空气质量预报成效评估方法技术指南[M]. 北京: 中国环境出版集团, 2018.
[36]	中国环境监测总站. 关于印发《城市环境空气质量指数(AQI)预报评估技术规定(暂行)》和《区域环境空气质量预报评估技术规定(暂行)》的通知[EB/OL]. http://www.cnemc.cn/zzjj/jgsz/ybzx/gzdt_ybzx/202112/t20211203_962949.shtml, 2021-12-03.
[37]	Lyu B L, Zhang Y Z, Hu Y T. Improving PM_2.5 air quality model forecasts in China using a bias-correction framework[J]. Atmosphere, 2017, 8(8). DOI:10.3390/atmos8080147
[38]	June N, Vaughan J, Lee Y, et al. Operational bias correction for PM_2.5 using the AIRPACT air quality forecast system in the Pacific Northwest[J]. Journal of the Air & Waste Management Association, 2021, 71(4): 515-527.
[39]	黄志炯. 基于敏感性和不确定性分析的气溶胶数值模拟改进研究[D]. 广州: 华南理工大学, 2017. Huang Z J. Improvement of aerosol numerical modeling by using sensitivity analysis and uncertainty analysis[D]. Guangzhou: South China University of Technology, 2017.
[40]	Xu M, Jin J B, Wang G Q, et al. Machine learning based bias correction for numerical chemical transport models[J]. Atmospheric Environment, 2021, 248. DOI:10.1016/j.atmosenv.2020.118022
[41]	Bhargava K, Kalnay E, Carton J A, et al. Estimation of systematic errors in the GFS using analysis increments[J]. Journal of Geophysical Research: Atmospheres, 2018, 123(3): 1626-1637. DOI:10.1002/2017JD027423
[42]	Goswami T, Rao S A, Hazra A, et al. Assessment of simulation of radiation in NCEP climate forecasting system (CFS V2)[J]. Atmospheric Research, 2017, 193: 94-106. DOI:10.1016/j.atmosres.2017.04.013
[43]	张旭. 基于神经网络的空气质量预测[D]. 南京: 南京信息工程大学, 2019. Zhang X. Air quality prediction based on neural network[D]. Nanjing: Nanjing University of Information Science and Technology, 2019.
[44]	智协飞, 吴佩, 俞剑蔚, 等. GFS模式地形高度偏差对地面2m气温预报的影响[J]. 大气科学学报, 2019, 42(5): 652-659. Zhi X F, Wu P, Yu J W, et al. Impact of topographic altitude bias of the GFS model on the 2 m air temperature forecast[J]. Transactions of Atmospheric Sciences, 2019, 42(5): 652-659.
[45]	龚伟伟, 师春香, 张涛, 等. 中国区域多种数值模式资料的地面气象要素评估[J]. 气候与环境研究, 2015, 20(1): 53-62. Gong W W, Shi C X, Zhang T, et al. Evaluation of surface meteorological elements from several numerical models in China[J]. Climatic and Environmental Research, 2015, 20(1): 53-62.
[46]	Yang F L, Pan H L, Krueger S K, et al. Evaluation of the NCEP global forecast system at the ARM SGP site[J]. Monthly Weather Review, 2006, 134(12): 3668-3690. DOI:10.1175/MWR3264.1
[47]	朱媛媛, 高愈霄, 汪巍, 等. 2019年10~12月京津冀及周边"2+26"城市重污染减排效果评估[J]. 环境科学, 2020, 41(10): 4402-4412. Zhu Y Y, Gao Y X, Wang W, et al. Assessment of emergency emission reduction effect during the heavy air pollution episodes in Beijing, Tianjin, Hebei, and its Surrounding area ("2+26" cities) from October to December 2019[J]. Environmental Science, 2020, 41(10): 4402-4412. DOI:10.3969/j.issn.1000-6923.2020.10.026


环境科学 2022, Vol. 43 Issue (2): 663-674	PDF