环境科学  2025, Vol. 46 Issue (5): 2642-2653   PDF    
基于可解释性机器学习的滨海城市臭氧驱动因素
王超龙1, 薛莲2, 张宜升1, 覃笑飞1, 方渊2, 陶文鑫1, 杜金花1, 张苏凡1, 王冠3, 顾达萨4, 崔杉杉1     
1. 青岛理工大学环境与市政工程学院, 青岛 266525;
2. 山东省青岛生态环境监测中心, 青岛 266003;
3. 青岛市生态环境局市南分局, 青岛 266003;
4. 香港科技大学环境与可持续发展学部, 香港 999077
摘要: 选取青岛16个环境空气监测点位(含8个国控点、7个省控点和1个背景点)大气污染物及相邻近气象点位数据, 耦合极端梯度提升(XGBoost)模型, 使用可解释性SHAP模块, 探讨气象要素和大气污染物排放对臭氧(O3)的影响. 结果表明, 2019~2023年, 气象因素对O3生成贡献率达67.7%, 大气污染物排放对O3生成贡献率为32.3%. 地表太阳辐射在10:00~17:00对O3生成贡献最大. 相对湿度低于70%时有利于O3生成, 特别是在12:00~16:00, 相对湿度对O3生成有正向贡献, 相对湿度高于70%对O3生成负贡献概率为94%. 边界层高度低于500 m时, 对O3浓度有正向影响, 超过该高度其影响将减弱, 且早晨和午后时段, 边界层高度对O3生成有正向作用. 东风(E)到西南风(SW)对O3浓度有正向影响. NO2在06:00~11:00呈负响应, 在12:00~15:00呈正响应. PM2.5在07:00~14:00对O3浓度有正向作用, 在15:00~18:00则有抑制影响. O3浓度的主导因素在不同站点和季节间存在显著差异, 其中崂山区西部、仰口、市南区西部、西海岸新区东部和西海岸新区西部点位地表面太阳辐射对O3影响明显低于其它各点位, 崂山区西部、市南区西部、西海岸新区东部点位NO2的影响最大, 西海岸新区东部、崂山区西部和仰口点位PM2.5对O3生成的影响显著高于青岛市其它点位. 春季崂山区西部和市南区西部NO2的影响更为显著;夏季仰口、西海岸新区东部和西部、崂山区西部和市北区北部点位地表面太阳辐射影响更为显著, 其余点位影响O3的关键因子为相对湿度;秋季温度和地表面太阳辐射是影响O3的主要因素;冬季NO2贡献高于其他季节, 主要受高强度人为源排放的影响;O3超标日分析结果表明, 地表面太阳辐射和NO2为主要驱动因素;各站点PM2.5和PM10对O3超标日总SHAP值在6.1~12.4 μg·m-3.
关键词: 臭氧(O3      机器学习      驱动因素      SHAP模块      青岛     
Urban Ozone Driving Factors Based on Explainable Machine Learning
WANG Chao-long1 , XUE Lian2 , ZHANG Yi-sheng1 , QIN Xiao-fei1 , FANG Yuan2 , TAO Wen-xin1 , DU Jin-hua1 , ZHANG Su-fan1 , WANG Guan3 , GU Da-sa4 , CUI Shan-shan1     
1. School of Environmental and Municipal Engineering, Qingdao University of Technology, Qingdao 266525, China;
2. Qingdao Eco-environment Monitoring Center of Shandong Province, Qingdao 266003, China;
3. Qingdao Municipal Bureau of Ecology and Environment, Qingdao 266003, China;
4. Division of Environment and Sustainability, Hong Kong University of Science and Technology, Hong Kong 999077, China
Abstract: Sixteen sites in the coastal city of Qingdao, including eight national control sites, seven provincial control sites, and one background site, were selected. By coupling the extreme gradient boosting (XGBoost) model with the interpretability SHapley Additive exPlanations (SHAP) module, the impact of meteorological elements and atmospheric pollutant emissions on ozone (O3) pollution was investigated. The results indicated that from 2019 to 2023, meteorological factors contributed 67.7% to O3 formation, whereas emissions from atmospheric pollutants accounted for 32.3%. Surface solar radiation significantly affected O3 formation from 10:00 to 17:00. A positive correlation existed between temperature and O3 concentration, peaking at 14:00. A relative humidity below 70% was conducive to O3 formation and a relative humidity above 70% had a 94% probability of negatively contributing to O3 production. Particularly between 12:00 and 16:00, relative humidity significantly and positively contributed to O3 formation. When the boundary layer height was below 500 meters, it positively affected O3 concentration, whereas above this height, its impact weakened. In the morning and late afternoon, boundary layer height promoted the formation of O3 concentration. Easterly (E) to southwesterly (SW) winds had a positive effect on O3 concentrations in Qingdao. NO2 showed a negative response in the morning (06:00-11:00) and a positive response in the afternoon (12:00-15:00). PM2.5 had a nonlinear positive correlation with O3, positively affecting O3 concentration from 07:00 to 14:00 PM and suppressing it from 15:00 to 18:00. Significant differences existed in the dominant factors of O3 concentration across different areas and seasons. In the western Laoshan District, Yangkou, the western site of the Shinan District, and eastern and western parts of the West Coast New Area, surface solar radiation had a noticeably lower impact on O3 than in other locations. The effect of NO2 was most significant in the eastern parts of the West Coast New Area, western Laoshan District, and Yangkou. PM2.5 affected O3 formation more in these sites than in others of Qingdao. In spring, the impact of NO2 was more significant in the western Laoshan and Shinan Districts. In summer, surface solar radiation was more influential in Yangkou, the eastern and western parts of the West Coast New Area, the western Laoshan District, and the Shibei District, whereas, relative humidity was the key factor in other locations. In autumn, temperature and surface solar radiation were the main factors affecting O3. In winter, the contribution of NO2 was higher than that in different seasons, with anthropogenic emissions playing a more important role in O3 formation. The analysis of days exceeding O3 standards showed that surface solar radiation and NO2 were the main drivers of exceeding O3 concentrations. For all sites, the total SHAP values of PM2.5 and PM10 on days exceeding O3 standards ranged between 6.1 μg·m-3 and 12.4 μg·m-3.
Key words: ozone (O3)      machine learning      driving factors      SHAP module      Qingdao     

臭氧(O3)浓度的持续上升已成为公众日益关注环境污染问题[1, 2]. 长期暴露于高浓度O3环境中, 可能会面临心血管疾病和呼吸系统疾病等健康风险[3, 4]. O3的形成受多种前体物质、化学反应和气象条件的影响[5~7], 各驱动因素之间存在着复杂的非线性关系, 在这种复杂大气环境中, 识别和理解以上条件和因素的相互作用变得更加重要[8].

为模拟和预测地面O3浓度的分布及其变化趋势, 传统上采用如WRF-Chem和CMAQ等大气化学输送模型[9]. 然而, 以上模型的准确性高度依赖于精确的初始条件、可信的排放清单以及对O3生成机制的深入理解[10]. 以上模型通常面临空间分辨率限制和高昂的计算成本问题[11]. 近年来, 为了克服以上挑战, 机器学习方法因其数据驱动的特性而备受关注, 其能够有效地捕捉输入特征与输出变量之间的复杂非线性关系[12].

然而, 机器学习模型的“黑箱”特性使得模型的解释性成为难题, 为了提高模型的可解释性, 基于博弈论的可解释性(SHapley Additive exPlanations, SHAP)算法应运而生, 它能够在不同尺度上量化输入特征对预测结果的贡献[13]. Nelson等[14]和Sadeghi等[15]使用SHAP算法分析了美国得克萨斯州、休斯敦和达拉斯的大气污染物和气象因素对O3形成的影响, 发现湿度和温度对休斯敦和达拉斯的O3污染贡献最大, 而太阳辐射强度显著影响了得克萨斯州的O3变化. SHAP值方法已被应用于京津冀、珠江三角洲、长江三角洲、四川盆地、兰州等[16~18], 用于识别O3浓度的贡献因素, 有研究表明, 气象因素变化在长江三角洲、四川盆地和兰州的O3浓度变化中起到主导作用, 而在京津冀和珠江三角洲地区, O3浓度变化主要受大气污染物排放的驱动.

研究和揭示以上驱动因素及其相互关系对于制定有效的空气质量监管策略至关重要, 但定量评估它们对O3形成的具体影响仍存在困难, 主要由于复杂的化学反应机制、多变的环境条件以及数据的不完备性[19]. 本研究利用可解释性机器学习模型, 分析了2019~2023年青岛市16个点位(含8个国控点、7个省控点和1个背景点)大气污染物及相邻近气象点位各气象参数数据, 为分析提供更加可信的数据集. 采用极端梯度提升(XGBoost)模型和可解释性SHAP算法, 分析青岛市各区域气象要素和大气污染物对O3浓度的影响及贡献, 确定不同季节影响O3浓度关键因子, 探讨不同季节气象要素和大气污染物对O3浓度的影响及贡献, 以及在O3超标日各子站影响O3浓度的关键驱动因素, 以期为区域O3的分类管控提供依据, 通过量化关键驱动因素的影响, 支持更精准的污染治理和政策制定.

1 材料与方法 1.1 数据来源及处理

选取滨海城市青岛8个国控环境空气监测子站(市南区西部、市北区北部、崂山区西部、城阳区北部、李沧区北部、西海岸新区东部、西海岸新区西部、即墨区2号)、7个省控环境空气监测子站(即墨区1号、胶州市1号、胶州市2号、平度市1号、平度市2号、莱西市1号、莱西市2号)和仰口环境空气监测背景点(图 1), 以各区域2019年1月1日至2023年12月31日昼间07:00~18:00作为模拟时段. 污染物[二氧化硫(SO2)、二氧化氮(NO2)、O3、一氧化碳(CO)、可吸入颗粒物(PM10)和细颗粒物(PM2.5)]浓度小时数据来自选定的国控和省控监测点位;温度(Temp)、相对湿度(RH)、风速(WS)、风向(WD)和降水量(PRCP)小时数据来自子站相邻气象点位的数据. 地面太阳辐射(Sun Flux, SF)和边界层高度(PBL)数据提取自美国国家海洋和大气管理局(NOAA)的GDAS气象数据集(ftp://arlftp.arlhq.noaa.gov/pub/archives/gdas1/, 访问时间:2024年3月). O3(8 h)第90百分位数计算方法、评价方法参考《环境空气质量评价技术规范》(试行)(HJ 663-2013), O3超标日指O3(8 h)超过160 μg·m-3, O3(8 h)-90PER指一个日历年内O3(8 h)的第90百分位数.

1.市南区西部, 2.市北区北部, 3.崂山区西部, 4.仰口背景点, 5.李沧区北部, 6.城阳区北部, 7.西海岸新区东部, 8.西海岸新区西部, 9.胶州市1号, 10.胶州市2号, 11.即墨区1号, 12.即墨区2号, 13.莱西市1号, 14.莱西市2号, 15.平度市1号, 16.平度市2号 图 1 青岛市大气自动监测点位 Fig. 1 Atmospheric automatic detection sites in Qingdao

总空气质量监测数据和地面气象观测数据的缺失率小于1.0%. 过多缺失值会对数据质量产生一定影响, 并使分析结果产生较大误差, 本研究将缺失值连续大于5 h的环境空气质量监测数据和地面气象观测数据删除, 将≤5 h的数据使用KNNImputer[20]函数补充, 该函数通过欧几里德距离矩阵寻找最近邻, 估算缺失值[21].

1.2 模型介绍

本研究使用XGBoost算法, 采用网格搜索验证法[21]优化模型的参数配置. XGBoost模型是一种集成学习算法[22], 该方法是boosting方法的一种加法模型, 模型训练采用前向分布算法进行贪婪学习, 它是由多个弱分类器(决策树)构成的一个强分类器, 每棵决策树的输入样本和其前一棵树的训练与预测结果相关, 最后将所有决策树的预测结果累加作为最终预测结果, XGBoost具有L1和L2正则化的梯度提升, 可防止模型过度拟合. 具有良好的泛化能力[23]. 同时XGBoost模型精度高、灵活性强, 具备处理缺失值等优势. 已在识别影响PM2.5浓度的关键因素[24]、O3污染成因[25]和水质监测[26]等领域广泛应用, 其计算公式如下:

(1)

式中, 表示模型第t次迭代后样本i的预测结果;表示前t-1棵弱决策树的预测结果;ft(xi)表示第t棵树的模型;F为所有可能决策树的集合.

XGBoost算法的目标函数由损失函数和正则项组成, 通过迭代实现目标函数的最小化, 迭代后的目标函数表达式如下所示:

(2)
(3)

式中, L表示损失函数;n表示样本数;Objt表示第t轮迭代的目标函数;Ω表示抑制模型复杂度的正则项, 防止过拟合[27].

1.3 模型超参数优化及评估

机器学习算法中包含多种超参数, 因此需选择恰当的超参数组合来控制模型的复杂度以提高模型在独立数据集上的学习效果, 并防止过拟合. 本研究采用网格搜索(GridSearchCV)[20]验证法进行超参数优化, 选择对模型效果影响最大的4种参数, 并在指定的参数空间中进行遍历搜索, 获得最优超参数组合. 以XGBoost模型为例, 关键超参数设置如表 1所示.

表 1 模型超参数调优细节 Table 1 Details of hyperparameter tuning of the model

为定量评价模型模拟结果的准确度, 采用平均绝对差值(mean absolute error, MAE)、均方根误差(root mean square error, RMSE)和决定系数(squared correlation coefficient, R2)对3种机器学习模型进行定量评价[23].

(4)
(5)
(6)

式中, n表示样本数量, уiyiŷi分别为第i个样本的实测值、实测值的均值和预测值. MAE和RMSE表示评估模拟值和真实值的差异, 两种指标值越低越准确;R2表示评价回归性能, 值越大模拟效果越好[28].

结果表明, XGBoost模型模拟青岛市MAE(12.24 μg·m-3)和RMSE(17.16 μg·m-3)值较低且R2(0.83)较高, 模拟各区域MAE和RMSE在11.17~13.23 μg·m-3和15.03~18.14 μg·m-3之间, R2在0.76~0.88之间(表 2), 表明模型模拟结果准确度相对较高且回归效果较好, XGBoost模型主要通过引入损失函数的二阶泰勒展开和正则项, 优化模型复杂度, 从而避免了过拟合[28]. 本研究同步选取随机森林(random forest, RF)和梯度提升决策树(gradient boosting decision tree, GBDT)模型与XGBoost模型进行比较, RF的MAE和R2分别在11.68~13.89 μg·m-3和0.75~0.80之间;GBDT的MAE和R2分别在12.14~14.13 μg·m-3和0.72~0.78之间;模拟结果准确度回归效果均没有XGBoost模型高;RF模型max_depth参数值较大, 模型复杂度高, 易发生过拟合, GBDT模型训练时间长, 模型调整较复杂[23].

表 2 模型评价指标结果 Table 2 Model evaluation metric results

1.4 可解释性SHAP模块

可解释性SHAP模块是一种加性特征归因方法[29], 常用于解释复杂模型[30]. 在环境科学和大气污染研究中, SHAP被用来分析和解释O3和其他大气污染物浓度变化的驱动因素. 通过应用SHAP, 研究者可以识别哪些特征(如气象条件、排放源、化学反应等)在模型预测中起着关键作用, 且可以量化以上因素在不同时间点的影响程度[27, 31]. 计算公式如下:

(7)

式中, ϕi表示第i个输入值的Shapley值;S表示排除了第i个输入值的一组输入值;N表示训练集中所有特征的集合;F表示所有特征数量;S表示模型中使用的特征子集;fSxS)表示机器学习模型在子集i条件下的模拟值;fS∪{i}表示的是在特征集的基础上加上特征I, 然后再根据树的结构和叶子节点的取值等, 计算出样本的平均值;

SHAP将模型的输出视为输入变量的线性和, 并使用SHAP值来表示每个特征变量的贡献. 假设输入模型具有特征变量x=(x1, x2, …, xM), 则原始模型f(x)的解释模型g(x')可表示为:

(8)

式中, x表示从数据集中的原始输入变量x获得的简化输入变量的向量;M表示输入特征变量的数量;当所有输入为空时, ϕ0为常数;ϕi表示每个特征i的属性值.

2 结果与讨论 2.1 臭氧污染特征

2019~2022年各点位ρ[O3(8h)-90PER]总体呈下降态势(表 3), 但自2023年以来反弹明显, 超过国家二级标准(160 μg·m-3). 2019年各点位ρ[O3(8h)]年均值为(100.3±4.5)μg·m-3, 2021年降至(98.3±4.9)μg·m-3, 2023年增至(108.0±3.9)μg·m-3表 3). O3(8h)浓度月变化呈“双峰型”, 每年1~5月, O3(8h)浓度处于上升阶段, 在5~6月达到第一个峰值, 7月有所下降, 8月再次上升, 在8~9月达到第二个峰值, 之后持续降低. 各站点O3超标日主要集中在5~9月(表 4).

表 3 基于16个观测点位的~2023年青岛市ρ[O3(8h)]年均值及ρ[O3(8h)-90PER]/μg·m-3 Table 3 Based on 16 observation sites, the annual average values of ρ[O3(8h)] and ρ[O3(8h)-90PER] in Qingdao from 2019 to 2023/μg·m-3

表 4 2019~2023基于16个观测点位的青岛市O3(8h)月均值及超标率 Table 4 Based on 16 observation sites, the monthly average values and exceedance rates of O3(8h)in Qingdao from 2019 to 2023

2.2 驱动因素重要性及影响分析

采用XGBoost模型评估气象要素和大气污染物等驱动因素对O3浓度的影响及其贡献结果见图 2(a), SF、Temp、RH、NO2、PM2.5和PBL为关键预测因子. 气象因素对O3生成的贡献率为67.7%[图 2(b)]. Zhang等[32]使用集成机器学习模型(EML)结合SHAP方法量化了气象变量对杭州城区O3的影响, 发现气象因素对O3生成的贡献为58%, Dang等[33]利用GEOS-Chem模型评估了2012~2017年中国(454个城市, 1 597个站点)夏季地表O3浓度, 亦发现气象因素为主要贡献因素, 对MDA8-O3增长的贡献达84%.

图 2 驱动因素重要性及贡献率 Fig. 2 Importance of drivers and weighting of contributions

从SHAP值来看, Temp、SF、RH和PBL是影响O3形成的主要气象因子, 占总气象影响的60.6%, WD、WS和PRCP的影响相对较小. SF升高会加速光化学反应, 促进O3生成速率的加快, 同时也促进NO2的光解作用形成O3[34], 并与O3水平正相关[图 3(a)];当SF超过350 W·m-2时, 对O3污染的正向贡献概率为96%[32];且在正午至下午(10:00~17:00)的正向影响最强, 其它时段的负向影响最强[图 4(a)].

图 3 基于XGBoost模型的SHAP特征分析 Fig. 3 SHAP feature analysis based on XGBoost model

图 4 基于XGBoost模型的SHAP值日变化 Fig. 4 Daily variation in SHAP values based on the XGBoost model

Temp与O3浓度呈正相关[图 3(b)], Temp升高时, 加速光化学反应速率, 从而促进O3的生成[35, 36]. 当Temp在25~30℃时, O3浓度受到抑制[图 3(b)], 可能由于VOCs和NOx反应速率降低, 同时O3和NOx的光解速率增加. 有研究表明, O3抑制事件的临界温度介于19.2~39.3℃之间[37]. Temp的SHAP值在早上(7:00~11:00)影响相对较低, 在中午14:00达到峰值, 之后再次降低[图 4(b)].

RH对O3的主要影响表现为非线性负相关[图 3(e)], 表明低RH对O3浓度的升高有增强作用[38]. 在12:00~16:00, RH对O3生成有正向贡献[图 4(c)], 可能受其它气象因素的影响, 如温度、太阳辐射等[39]. 当相对湿度低于约70%时, 对O3污染的正贡献概率为95%, 而当RH超过70%时, 对O3污染的负贡献概率为94%, 与长三角地区的研究一致[40], 即当RH超过70%时, O3水平与RH呈负相关, 这种负相关可能是由于高RH对O3形成的抑制作用, 主要是通过将含NO2/ONO2的产物转移到颗粒相[41], 此外, 高RH导致空气中水蒸气含量大, 易吸附游离氧分子, 加速O3的消耗[32], 同时, RH还可能通过HONO光解作用影响大气OH自由基的生成来影响O3的形成[42].

随PBL高度的增加, 其对O3的影响逐渐减弱[图 3(f)], 可能由于污染物稀释和大气对流导致[43]. PBL < 500 m时, 对O3污染的正向贡献概率为93%;PBL > 500 m时, O3对边界层高度的响应逐渐减少, 与东北地区[43]和汾渭平原[44]研究的结果一致. 此外PBL主要在清晨和午后对O3有正向的影响, 而在中午时段SHAP值下降[图 4(e)], 这可能由于在PBL较高时, 如清晨或午后晚些时段, 空气中的污染物会更多地被混合和稀释, 这可能对O3浓度产生正向影响. 相反, 在中午时分, PBL高度较低时, 则可能导致稀释作用减弱及相应的污染物积累, 对O3形成产生抑制作用[43]. 此外[图 3(g)], 东风(E)到西南风(SW)对青岛市的O3浓度有正向影响, 推测存在海上污染气团的输送[45]. 张淼等[46]在青岛市市北区南部点位, 基于2015-2019年近地面O3观测数据结果表明, 主导风向为海上偏东南风(SSE和S)时, 可能存在海上污染气团输送的影响.

大气污染物NO2、CO、PM2.5、PM10和SO2对O3生成的贡献占32.3%[图 2(b)], NO2以上污染物中占比最高, 为16.9%. NO2与O3之间呈负相关[图 3(c)], 可能由于NO和NO2呈正相关, 而NO会滴定O3, 从而降低O3浓度[10]. PM2.5与O3呈非线性正关系[图 3(d)]. 这可能与PM2.5指示其排放源活动水平, 从而影响O3前体物浓度及其他环境因子有关[47]. 值得注意的是, NO2对O3的形成在上午(6:00~11:00)呈负响应, 而在下午(12:00~15:00)呈正响应[图 4(f)]. 这与Zhang等[32]在杭州的研究结果一致. Wang等[48]利用CMAQ模型分析了长三角地区O3对前体物质的敏感性, 发现O3在上午对VOCs排放更敏感, 而在下午对NOx排放更敏感. 而PM2.5在07:00~14:00对O3的预测浓度有正向的贡献, 这可能与早晨时段交通排放和光化学活动刚开始增加有关[49]. 在15:00~18:00, PM2.5对O3浓度有负向的影响[图 4(d)], 可能由于细颗粒物通过直接散射或吸收太阳辐射, 间接改变云的光学特性, 从而降低了地面附近的光化学反应光速率, 并抑制了光解反应, 最终减少了O3的生成[50].

2.3 各点位空间分布特征的SHAP分析

对各点位O3形成的气象变量和污染物进行了量化评估, 进一步阐明了SHAP值的空间分布特征(图 5). 各点位气象因素(SF和Temp等)对O3的影响高于大气污染物(NO2和PM2.5等)对O3的影响. 青岛位于海岸线附近, 来自海洋的清洁气团常有助于稀释城市污染, 有助于气象因素在O3形成中起主导作用[51].

1.仰口背景点, 2.市北区北部, 3.市南区西部, 4.平度1号, 5.平度2号, 6.李沧区北部, 7.崂山区西部, 8.莱西1号, 9.莱西2号, 10.胶州1号, 11.胶州2号, 12.即墨1号, 13.即墨2号, 14.西海岸新区西部, 15.西海岸新区东部, 16.城阳区北部 图 5 青岛市各区域驱动因素对O3的贡献率 Fig. 5 Contribution of regional drivers to O3 in Qingdao

在气象因素方面, 各点位SF和Temp仍是青岛各地区O3形成的关键因子, 各点位SF和Temp总贡献率在38%~53%之间, 这与晋城[23]开展的研究结果一致. 有研究表明, 晋城市SF和Temp总贡献率为53.4%. 其次是RH和PBL, 贡献率分别在5%~10%和4%~7%之间. 而崂山区西部和市南区西部等点位, SF对O3的影响相对较低. Temp对青岛各点位O3形成的影响较大. 此外, 崂山区西部和仰口背景点点位的RH对O3的贡献也较低, 而PBL对O3的影响在各点位相对稳定, SHAP值在2.4~4.2 μg·m-3之间, 其在莱西市、胶州市、平度市和即墨区点位的贡献较小, 以上差异可能受地区特定地形和气象条件的影响[52, 53].

在大气污染物方面, 各点位O3主要的驱动因素为NO2和PM2.5, NO2排放主要集中在工业区和交通繁忙地区(市南区西部和崂山区西部等), 而在西海岸新区东部和崂山区西部PM2.5的影响对O3生成影响显著, 可能与以上地区较高的工业和交通排放强度有关[54].

2.4 基于SHAP的O3污染季节驱动因素分析

利用SHAP算法对各驱动因素对O3浓度的贡献率进行计算, 量化了不同季节气象要素及大气污染物对青岛各区域O3的影响(图 6). 春季影响O3浓度的关键因素为Temp(贡献率为15%~34%)和SF(贡献率为15%~27%). Liu等 [55]量化了我国城市人为前体物排放与环境因子对O3浓度的影响, 结果表明, 我国城市O3浓度在春季主要受环境因子影响(日照和气温对O3浓度的贡献率分别为26%和15%). 春季气温逐渐升高, 紫外线辐射增强影响大气中化学反应速率, 加速光化学反应, 从而促进O3的形成[56]. 在一些点位, 如西海岸新区东部、李沧区北部、市北区北部、莱西市1号和莱西市2号点位SF是影响O3浓度的关键因素. 而在崂山区西部和市南区西部点位, NO2的影响更为显著, 贡献率为24%和23%.

(a)春季, (b)夏季, (c)秋季, (d)冬季;1.市北区北部, 2.市南区西部, 3.平度1号, 4.平度2号, 5.李沧区北部, 6.崂山区西部, 7.莱西1号, 8.莱西2号, 9.胶州1号, 10.胶州2号, 11.即墨1号, 12.即墨2号, 13.西海岸新区西部, 14.西海岸新区东部, 15.城阳区北部, 16.仰口背景点 图 6 各区域各季节气象要素和大气污染物对O3的贡献率 Fig. 6 Contribution rate of meteorological elements and air pollutants to O3 by region and season

夏季影响O3浓度的关键因素是RH和SF. 在城阳区北部、李沧区北部、即墨区1号和即墨区2号等点位, RH是影响O3浓度的关键因素, 贡献率在21%~29%之间. 王聪慧等[57]探究银川市城市公园不同季节影响O3的关键因子, 发现夏季影响O3的气象因子主要为RH, 贡献率为20.7%. Liu等[55]研究表明我国城市O3浓度在夏季RH贡献率为29%. 而在崂山区西部和市北区北部等点位, SF对O3浓度的影响更为显著, 贡献率分别为19%和22%.

秋季温度开始下降, 但日照依然充足. SF在多数点位仍然是影响O3的关键因子. 如仰口背景点(30%)、胶州市2号(28%)、胶州市1号(27%)、平度市2号(24%)、李沧区北部(24%)和城阳区西部(21%). 在崂山区西部、市南区西部和市北区北部等点位, Temp也起到了重要作用, 贡献率在26%~35%之间.

冬季, 由于取暖和工业排放等原因[58], NO2在所有点位均为影响O3的关键因素, 贡献率在24%~41%之间, 王聪慧等[57]在银川开展的研究也表明, 冬季影响O3的关键因子为NO2, 贡献率为29.7%. 青岛市各点位冬季大气污染物的贡献高于其他季节, 表明人为排放在冬季对O3的形成有显著影响.

2.5 O3超标日污染特征

O3超标日单个驱动因素对O3的影响见图 7. SF为影响O3浓度超标的最大气象因素, 太阳辐射的强度直接影响光化学反应速率[32]. 在日照强烈时段, O3生成速度加快. 在夏季, 尤其是在日照时间长、紫外线强烈的区域, 如胶州市、李沧区和城阳区, SHAP值分别为31.82 μg·m-3(李沧区北部)、27.70 μg·m-3(城阳区北部)、29.26 μg·m-3(胶州市1号)和27.52 μg·m-3(胶州市2号).

图 7 各区域超标日气象要素和大气污染物对O3的驱动因素 Fig. 7 Drivers of O3 by over-standard daily meteorological elements and atmospheric pollutants in each region

NO2是导致青岛各点位O3超标的重要污染. O3超标日其SHAP值在7.07~17.3 μg·m-3. NO2作为O3的前体物, 在光化学反应中起着关键作用[58]. 工业区和交通繁忙区域的NO2排放量较高, 如崂山区西部、市南区西部和西海岸新区东部.

PM2.5和PM10对O3超标日总SHAP值在6.1~12.4 μg·m-3, 尤其是西海岸新区东部(12.4 μg·m-3)、崂山区西部(12.0 μg·m-3)、市南区西部(11.7 μg·m-3)和西海岸新区西部(10.8 μg·m-3). 它们不仅通过影响太阳辐射的传播和散射影响光化学反应, 还可能通过改变大气化学反应动力学和促进污染物沉降影响O3的生成[59].

2.6 基于SHAP值的站点O3分类管理

根据SHAP值的研究结果, 初步划分为高O3生成潜力区域和高污染排放区域(表 5). 并结合不同季节和时段的特点, 明确O3潜在管控路径高O3生成潜力区域. 高O3生成潜力区域, SHAP值较高, 通常伴随着高太阳辐射、高温度和低风速. 以上条件有利于光化学反应, 导致O3生成速率较高, 如胶州市、即墨区、平度市和莱西市可能属于这一类. 高污染排放区域包括工业区和交通繁忙区域, 如崂山区西部、市南区西部和西海岸新区东部, 以上区域通常有较高的NO₂和PM2.5排放. 此外, 高O3生成潜力区域主要以农业和轻工业为主, 而高污染排放区域为经济活动频繁的工业和商业中心. 对于不同季节和时段的O3管控路径, 春秋季温度适中, 光化学反应仍较为活跃, 应加强对工业排放的监管;夏季应加强高O3生成潜力区域的污染控制, 特别是在高温和高辐射条件下, 如崂山区西部、市南区西部和西海岸新区东部;冬季需关注局地污染物的积累, 适当限制污染源;全年则需对高污染排放区域持续监控和控制排放, 尤其是在工业活动和交通高峰期. 基于SHAP值的分析可为青岛市制定更加科学的O3污染控制策略, 减少其对生态环境和公众健康的影响.

表 5 不同时段各点位气象因素和大气污染物对O3的影响1) Table 5 Influence of meteorological factors and atmospheric pollutants on O3 at sites in the different time period

3 结论

(1)2019~2023年气象因素对青岛市O3生成的贡献率达67.7%, 大气污染物为32.3%. SF高于350 W·m-2时, 对O3的正向贡献概率为96%;正午至下午(10:00~17:00)的正向影响最强;Temp在25~30℃时, O3浓度可能会受到抑制. RH低于70%时, 对O3的正贡献概率为95%, 当RH超过70%时, 对O3的负贡献概率为94%;PBL < 500 m时, 对O3的正向贡献概率为93%;PBL > 500 m时, O3对边界层高度的响应逐渐减少. 东风(E)到西南风(SW)对O3浓度有正向影响. NO2在上午(06:00~11:00)呈负响应, 而在下午(12:00~15:00)呈正响应.

(2)各点位气象因素对O3形成的影响大于大气污染物. 春季崂山区西部和市南区西部NO2的影响更为显著;夏季除西海岸新区东部和西部、崂山区西部和市北区北部点位外, 影响O3的关键因子是RH;秋季影响O3的关键因子是SF和Temp;冬季NO2在所有点位均是影响O3的关键因子. SF是影响O3浓度超标的最大气象因素;NO2是青岛各区域O3超标日的主要大气污染物.

(3)对青岛市各区域初步分类为2类. 高O3生成潜力区域(胶州市、即墨区、平度市和莱西市)和高污染排放区域(崂山区西部、市南区西部和西海岸新区东部等).

参考文献
[1] Zhang L, Wang L L, Liu B Y, et al. Contrasting effects of clean air actions on surface ozone concentrations in different regions over Beijing from May to September 2013-2020[J]. Science of the Total Environment, 2023, 903. DOI:10.1016/j.scitotenv.2023.166182
[2] Chen Z M, Zhou T J, Chen X L, et al. Observationally constrained projection of Afro-Asian monsoon precipitation[J]. Nature Communications, 2022, 13(1). DOI:10.1038/s41467-022-30106-z
[3] Xue T, Wang R H, Tong M K, et al. Estimating the exposure–response function between long-term ozone exposure and under-5 mortality in 55 low-income and middle-income countries: a retrospective, multicentre, epidemiological study[J]. The Lancet Planetary Health, 2023, 7(9): 736-746. DOI:10.1016/S2542-5196(23)00165-1
[4] Li B W, Huang J H, Hu X Y, et al. CCl4 emissions in eastern China during 2021-2022 and exploration of potential new sources[J]. Nature Communications, 2024, 15(1). DOI:10.1038/s41467-024-45981-x
[5] Li C, Zhu Q D, Jin X M, et al. Elucidating contributions of anthropogenic volatile organic compounds and particulate matter to ozone trends over China[J]. Environmental Science & Technology, 2022, 56(18): 12906-12916.
[6] Welsh B A, Corrigan M E, Assaf E, et al. Photophysical oxidation of HCHO produces HO2 radicals[J]. Nature Chemistry, 2023, 15(10): 1350-1357. DOI:10.1038/s41557-023-01272-4
[7] Cao J, Situ S P, Hao Y F, et al. Enhanced summertime ozone and SOA from biogenic volatile organic compound (BVOC) emissions due to vegetation biomass variability during 1981-2018 in China[J]. Atmospheric Chemistry and Physics, 2022, 22(4): 2351-2364. DOI:10.5194/acp-22-2351-2022
[8] Xu H, Yu H F, Xu B, et al. Machine learning coupled structure mining method visualizes the impact of multiple drivers on ambient ozone[J]. Communications Earth & Environment, 2023, 4(1). DOI:10.1038/s43247-023-00932-0
[9] He Z M, Liu P F, Zhao X X, et al. Responses of surface O3 and PM2.5 trends to changes of anthropogenic emissions in summer over Beijing during 2014-2019: a study based on multiple linear regression and WRF-Chem[J]. Science of the Total Environment, 2022, 807. DOI:10.1016/j.scitotenv.2021.150792
[10] Wang W H, Liu X, Bi J Z, et al. A machine learning model to estimate ground-level ozone concentrations in California using TROPOMI data and high-resolution meteorology[J]. Environment International, 2022, 158. DOI:10.1016/j.envint.2021.106917
[11] Peng Z Z, Zhang B, Wang D W, et al. Application of machine learning in atmospheric pollution research: a state-of-art review[J]. Science of the Total Environment, 2024, 910. DOI:10.1016/j.scitotenv.2023.168588
[12] Bland G D, Battifarano M, del Real A E P, et al. Distinguishing engineered TiO2 nanomaterials from natural Ti nanomaterials in soil using spICP-TOFMS and machine learning[J]. Environmental Science & Technology, 2022, 56(5): 2990-3001.
[13] Hou L L, Dai Q L, Song C B, et al. Revealing drivers of haze pollution by explainable machine learning[J]. Environmental Science & Technology Letters, 2022, 9(2): 112-119.
[14] Nelson D, Choi Y, Sadeghi B, et al. A comprehensive approach combining positive matrix factorization modeling, meteorology, and machine learning for source apportionment of surface ozone precursors: underlying factors contributing to ozone formation in Houston, Texas[J]. Environmental Pollution, 2023, 334. DOI:10.1016/j.envpol.2023.122223
[15] Sadeghi B, Ghahremanloo M, Mousavinezhad S, et al. Contributions of meteorology to ozone variations: application of deep learning and the Kolmogorov-Zurbenko filter[J]. Environmental Pollution, 2022, 310. DOI:10.1016/j.envpol.2022.119863
[16] Wang L, Zhao Y, Shi J S, et al. Predicting ozone formation in petrochemical industrialized Lanzhou city by interpretable ensemble machine learning[J]. Environmental Pollution, 2023, 318. DOI:10.1016/j.envpol.2022.120798
[17] Cheng Y, Huang X F, Peng Y, et al. A novel machine learning method for evaluating the impact of emission sources on ozone formation[J]. Environmental Pollution, 2023, 316. DOI:10.1016/j.envpol.2022.120685
[18] Weng X, Forster G L, Nowack P. A machine learning approach to quantify meteorological drivers of ozone pollution in China from 2015 to 2019[J]. Atmospheric Chemistry and Physics, 2022, 22(12): 8385-8402. DOI:10.5194/acp-22-8385-2022
[19] Li R, Cui L L, Fu H B, et al. Satellite-based estimation of full-coverage ozone (O3) concentration and health effect assessment across Hainan Island[J]. Journal of Cleaner Production, 2020, 244. DOI:10.1016/j.jclepro.2019.118773
[20] Phillip R E, Penko A M, Palmsten M L, et al. A machine learning approach to predicting equilibrium ripple wavelength[J]. Environmental Modelling & Software, 2022, 157. DOI:10.1016/j.envsoft.2022.105509
[21] Bianco S D, Parca L, Petrizzelli F, et al. APOGEE 2: multi-layer machine-learning model for the interpretable prediction of mitochondrial missense variants[J]. Nature Communications, 2023, 14(1). DOI:10.1038/s41467-023-40797-7
[22] Niazkar M, Menapace A, Brentan B, et al. Applications of XGBoost in water resources engineering: a systematic literature review (Dec 2018–May 2023)[J]. Environmental Modelling & Software, 2024, 174. DOI:10.1016/j.envsoft.2024.105971
[23] 董佳奇, 胡冬梅, 闫雨龙, 等. 基于可解释性机器学习的城市O3驱动因素挖掘[J]. 环境科学, 2023, 44(7): 3660-3668.
Dong J Q, Hu D M, Yan Y L, et al. Revealing driving factors of urban O3 based on explainable machine learning[J]. Environmental Science, 2023, 44(7): 3660-3668.
[24] Wang J J, He L, Lu X M, et al. A full-coverage estimation of PM2.5 concentrations using a hybrid XGBoost-WD model and WRF-simulated meteorological fields in the Yangtze River Delta Urban Agglomeration, China[J]. Environmental Research, 2022, 203. DOI:10.1016/j.envres.2021.111799
[25] Jung C R, Chen W T, Young L H, et al. A hybrid model for estimating the number concentration of ultrafine particles based on machine learning algorithms in central Taiwan[J]. Environment International, 2023, 175. DOI:10.1016/j.envint.2023.107937
[26] Zhang M Y, Huang Y Q, Xie D S, et al. Machine learning constructs color features to accelerate development of long-term continuous water quality monitoring[J]. Journal of Hazardous Materials, 2024, 461. DOI:10.1016/j.jhazmat.2023.132612
[27] 吴迪, 杜宁, 王莉, 等. 基于GTWR-XGBoost模型的四川省PM2.5小时浓度估算[J]. 环境科学, 2023, 44(7): 3738-3748.
Wu D, Du N, Wang L, et al. Estimation of PM2.5 hourly concentration in Sichuan province based on GTWR-XGBoost model[J]. Environmental Science, 2023, 44(7): 3738-3748.
[28] 康俊锋, 谭建林, 方雷, 等. XGBoost-LSTM变权组合模型支持下短期PM2.5浓度预测——以上海为例[J]. 中国环境科学, 2021, 41(9): 4016-4025.
Kang J F, Tan J L, Fang L, et al. Short-term PM2.5 concentration prediction based on XGBoost and LSTM variable weight combination model: a case study of Shanghai[J]. China Environmental Science, 2021, 41(9): 4016-4025.
[29] Lundberg S M, Erion G, Chen H, et al. From local explanations to global understanding with explainable AI for trees[J]. Nature Machine Intelligence, 2020, 2(1): 56-67.
[30] Zhang Z C, Xu B, Xu W M, et al. Machine learning combined with the PMF model reveal the synergistic effects of sources and meteorological factors on PM2.5 pollution[J]. Environmental Research, 2022, 212. DOI:10.1016/j.envres.2022.113322
[31] Campagnolo D, Borghi F, Fanti G, et al. Factors affecting in-vehicle exposure to traffic-related air pollutants: a review[J]. Atmospheric Environment, 2023, 295. DOI:10.1016/j.atmosenv.2022.119560
[32] Zhang L, Wang L L, Ji D, et al. Explainable ensemble machine learning revealing the effect of meteorology and sources on ozone formation in megacity Hangzhou, China[J]. Science of the Total Environment, 2024, 922. DOI:10.1016/j.scitotenv.2024.171295
[33] Dang R J, Liao H, Fu Y. Quantifying the anthropogenic and meteorological influences on summertime surface ozone in China over 2012-2017[J]. Science of the Total Environment, 2021, 754. DOI:10.1016/j.scitotenv.2020.142394
[34] Li K, Jacob D J, Liao H, et al. A two-pollutant strategy for improving ozone and particulate air quality in China[J]. Nature Geoscience, 2019, 12(11): 906-910.
[35] Zhong H B, Zhen L, Yao Q F, et al. Understanding the spatial and seasonal variation of the ground-level ozone in Southeast China with an interpretable machine learning and multi-source remote sensing[J]. Science of the Total Environment, 2024, 917. DOI:10.1016/j.scitotenv.2024.170570
[36] Wang J, Li J, Li X L, et al. Relationship between ozone and air temperature in future conditions: a case study in sichuan basin, China[J]. Environmental Pollution, 2024, 343. DOI:10.1016/j.envpol.2023.123276
[37] 欧林冲, 陈伟华, 伍永康, 等. 中国高温下臭氧抑制事件的时空特征及其影响因素[J]. 环境科学, 2023, 44(12): 6586-6597.
Ou L C, Chen W H, Wu Y K, et al. Spatio-temporal characteristics and influencing factors of ozone suppression events under high temperature in China[J]. Environmental Science, 2023, 44(12): 6586-6597.
[38] Dewan S, Lakhani A. Tropospheric ozone and its natural precursors impacted by climatic changes in emission and dynamics[J]. Frontiers in Environmental Science, 2022, 10. DOI:10.3389/fenvs.2022.1007942
[39] Ni J M, Jin J M, Wang Y M, et al. Surface ozone in global cities: a synthesis of basic features, exposure risk, and leading meteorological driving factors[J]. Geography and Sustainability, 2024, 5(1): 64-76.
[40] Wang L L, Liu B Y, Li R, et al. Prediction of daily PM2.5 and ozone based on high-density weather stations in China: nonlinear effects of meteorology, human and ecosystem health risks[J]. Atmospheric Research, 2023, 293. DOI:10.1016/j.atmosres.2023.106889
[41] Li R Y, Xu M Q, Li M C, et al. Identifying the spatiotemporal variations in ozone formation regimes across China from 2005 to 2019 based on polynomial simulation and causality analysis[J]. Atmospheric Chemistry and Physics, 2021, 21(20): 15631-15646.
[42] Li Q, Gabay M, Rubin Y, et al. Investigation of ozone deposition to vegetation under warm and dry conditions near the Eastern Mediterranean coast[J]. Science of the Total Environment, 2019, 658: 1316-1333.
[43] Su T N, Li Z Q, Kahn R. Relationships between the planetary boundary layer height and surface pollutants derived from lidar observations over China: regional pattern and influencing factors[J]. Atmospheric Chemistry and Physics, 2018, 18(21): 15921-15935.
[44] 李焕, 苏慧, 张婷, 等. 基于机器学习的汾渭平原PM2.5和O3变化特征及影响因素[J]. 环境化学, 2024, 43(5): 1585-1598.
Li H, Su H, Zhang T, et al. Variation characteristics and influencing factors of PM2.5 and O3 based on machine learning in Fenwei Plain[J]. Environmental Chemistry, 2024, 43(5): 1585-1598.
[45] Zheng Y H, Jiang F, Feng S Z, et al. Long-range transport of ozone across the eastern China seas: a case study in coastal cities in southeastern China[J]. Science of the Total Environment, 2021, 768. DOI:10.1016/j.scitotenv.2020.144520
[46] 张淼, 丁椿, 李彦, 等. 山东省O3时空分布及影响因素分析[J]. 环境科学, 2021, 42(12): 5723-5735.
Zhang M, Ding C, Li Y, et al. Spatial and temporal distribution of ozone and influencing factors in Shandong Province[J]. Environmental Science, 2021, 42(12): 5723-5735.
[47] 张涵, 姜华, 高健, 等. PM2.5与臭氧污染形成机制及协同防控思路[J]. 环境科学研究, 2022, 35(3): 611-620.
Zhang H, Jiang H, Gao J, et al. Formation mechanism and management strategy of cooperative control of PM2.5 and O3 [J]. Research of Environmental Sciences, 2022, 35(3): 611-620.
[48] Wang Y J, Yaluk E A, Chen H, et al. The importance of NOx control for peak ozone mitigation based on a sensitivity study using CMAQ-HDDM-3D model during a typical episode over the Yangtze River Delta region, China[J]. Journal of Geophysical Research: Atmospheres, 2022, 127(19). DOI:10.1029/2022JD036555
[49] Zhu J, Chen L, Liao H, et al. Correlations between PM2.5 and ozone over China and associated underlying reasons[J]. Atmosphere, 2019, 10(7). DOI:10.3390/atmos10070352
[50] Li M M, Wang T J, Xie M, et al. Agricultural fire impacts on ozone photochemistry over the Yangtze River Delta region, East China[J]. Journal of Geophysical Research: Atmospheres, 2018, 123(12): 6605-6623.
[51] Knowland K E, Doherty R M, Hodges K I, et al. The influence of mid-latitude cyclones on European background surface ozone[J]. Atmospheric Chemistry and Physics, 2017, 17(20): 12421-12447.
[52] 王旭东, 尹沙沙, 杨健, 等. 郑州市臭氧污染变化特征、气象影响及输送源分析[J]. 环境科学, 2021, 42(2): 604-615.
Wang X D, Yin S S, Yang J, et al. Characteristics, meteorological influences, and transport source of ozone pollution in Zhengzhou city[J]. Environmental Science, 2021, 42(2): 604-615.
[53] Li X L, Hu X M, Ma Y J, et al. Impact of planetary boundary layer structure on the formation and evolution of air-pollution episodes in Shenyang, Northeast China[J]. Atmospheric Environment, 2019, 214. DOI:10.1016/j.atmosenv.2019.116850
[54] Ren J, Guo F F, Xie S D. Diagnosing ozone–NOx –VOC sensitivity and revealing causes of ozone increases in China based on 2013-2021 satellite retrievals[J]. Atmospheric Chemistry and Physics, 2022, 22(22): 15035-15047.
[55] Liu P F, Song H Q, Wang T H, et al. Effects of meteorological conditions and anthropogenic precursors on ground-level ozone concentrations in Chinese cities[J]. Environmental Pollution, 2020, 262. DOI:10.1016/j.envpol.2020.114366
[56] 张涵, 姜华, 高健, 等. 我国大气O3污染成因及影响因素综述[J]. 环境科学研究, 2022, 35(12): 2657-2665.
Zhang H, Jiang H, Gao J, et al. Review on causes and influencing factors of O3 pollution in China[J]. Research of Environmental Sciences, 2022, 35(12): 2657-2665.
[57] 王聪慧, 施光耀, 杨思琪, 等. 银川城市公园气象及大气污染物对臭氧影响机制[J]. 环境科学, 2024, 45(9): 5149-5156.
Wang C H, Shi G Y, Yang S Q, et al. Effect of meteorological elements and air pollutants on ozone in Yinchuan city park[J]. Environmental Science, 2024, 45(9): 5149-5156.
[58] Yan C, Tham Y J, Nie W, et al. Increasing contribution of nighttime nitrogen chemistry to wintertime haze formation in Beijing observed during COVID-19 lockdowns[J]. Nature Geoscience, 2023, 16(11): 975-981.
[59] Ojha N, Soni M, Kumar M, et al. Mechanisms and pathways for coordinated control of fine particulate matter and ozone[J]. Current Pollution Reports, 2022, 8(4): 594-604.