环境科学  2024, Vol. 45 Issue (5): 2497-2506   PDF    
基于随机森林的北京城区臭氧敏感性分析
周红1, 王鸣1, 柴文轩2, 赵昕3     
1. 南京信息工程大学环境科学与工程学院, 江苏省大气环境与装备技术协同创新中心, 江苏省大气环境监测与污染控制高技术研究重点实验室, 南京 210044;
2. 中国环境监测总站, 北京 100012;
3. 南京科略环境科技有限责任公司, 南京 211800
摘要: 明确臭氧(O3)与前体物的非线性关系是O3防控措施制定的基础和关键. 基于北京城区站点2020年4 ~ 9月O3、挥发性有机物(VOCs)、氮氧化物(NOx)和气象要素在线观测, 分析了O3及其前体物污染特征, 利用随机森林(RF)模型结合SHAP值探究了影响O3的关键因素, 并通过多情景分析探讨了O3-VOCs-NOx敏感性. 相关性分析结果显示O3小时浓度与温度(T)呈显著正相关, 与TVOCs和NOx呈显著负相关;但从每日结果来看, O3T、TVOCs和NOx均呈显著正相关. RF模型模拟的O3浓度与实测值吻合较好, 进一步计算了各个特征变量的SHAP值, 结果显示T和NOx对O3影响最高, 但前者是正向影响, 而后者是负向影响. 以观测期间O3污染天的NOx和VOCs平均值为基础情景, 设置了对应不同NOx和VOCs的多种情景, 并利用RF模型计算不同情景下的O3, 得到O3等值线(EKMA曲线), 结果显示北京城区O3-VOCs-NOx敏感性处于VOCs控制区, 与基于观测的盒子模型(OBM)得到的结果一致, 这说明RF模型可以用作O3-VOCs-NOx敏感性分析的一种补充方法.
关键词: 北京      臭氧(O3      O3-VOCs-NOx敏感性      随机森林(RF)      SHAP值     
Ozone Sensitivity Analysis in Urban Beijing Based on Random Forest
ZHOU Hong1 , WANG Ming1 , CHAI Wen-xuan2 , ZHAO Xin3     
1. Collaborative Innovation Center of Atmospheric Environment and Equipment Technology, Jiangsu Key Laboratory of Atmospheric Environment Monitoring and Pollution Control, School of Environmental Science and Engineering, Nanjing University of Information Science & Technology, Nanjing 210044, China;
2. China National Environmental Monitoring Centre, Beijing 100012, China;
3. Nanjing Intelligent Environmental Science and Technology Co., Ltd., Nanjing 211800, China
Abstract: The basis and key step to developing ozone (O3) prevention and control measures is determining the non-linear relationship between O3 and its precursors. Based on online observations of O3, volatile organic compounds (VOCs), nitrogen oxides (NOx), and meteorological elements from April to September 2020 at an urban site in Beijing, we analyzed the pollution characteristics of O3 and its precursors, explored key factors affecting O3 using the random forest (RF) model combined with SHAP values, and explored the O3-VOCs-NOx sensitivity through a multi-scenarios analysis. The results of correlation analysis showed that the hourly concentration of O3 was significantly positively correlated with temperature (T) and negatively correlated with TVOCs and NOx. However, in terms of the daily values, O3 was significantly positively correlated with T, TVOCs, and NOx. The simulated O3 values by the RF model agreed with the measured values. The SHAP values of each characteristic variable were further calculated. The results suggested that T and NOx showed the two highest effects on O3, with positive and negative values, respectively. Based on the average NOx and VOCs on O3 pollution days during the observation period (the base scenario), multi-scenarios with different NOx and VOCs were set up. The RF model was used to calculateO3 under different scenarios and obtain the O3 isopleth (EKMA curve). The results showed that the O3-VOCs-NOx sensitivity in urban areas of Beijing was in the VOCs-limited regime, which was consistent with the results obtained from the observation-based box model(OBM). This indicated that the RF model could be used as a complementary method for O3-VOCs-NOx sensitivity analysis.
Key words: Beijing      ozone(O3)      O3-VOCs-NOx sensitivity      random forest (RF)      SHAP value     

近地面高浓度臭氧(O3)会对人体健康和生态环境产生不利影响[1 ~ 3], 同时也会导致温室效应的产生[4]. 2020年全国以O3为首要污染物的超标天数占总超标天数的比例高达37.1%, 仅次于PM2.5[5]. 其中, 京津冀地区以O3为首要污染物的超标天数占总超标天数的46.6%, 与PM2.5相当(48.0%)[5], O3污染已成为京津冀地区主要空气污染问题之一. 近地面O3主要由挥发性有机物(volatile organic compounds, VOCs)与氮氧化物(nitrogen oxides, NOx = NO+NO2)等前体物在光照下发生光化学反应生成[6], 而且O3生成与VOCs和NOx呈高度非线性关系[7, 8]. 因此, 开展O3生成与前体物VOCs和NOx(O3-VOCs-NOx)敏感性分析, 识别VOCs和NOx在O3生成中的作用, 是O3防控对策制定的基础和关键.

目前用于O3-VOCs-NOx敏感性分析的技术有:基于排放的三维空气质量模型(emission-based model, EBM)[9, 10]、基于观测的盒子模型(observation-based model, OBM)[11 ~ 13]和机器学习(machine learning, ML)[14, 15]等. EBM需要输入详细的排放清单和气象场[16], 而O3前体物(尤其是VOCs)排放清单的不确定性可能影响O3-VOCs-NOx敏感性分析结果[17, 18]. OBM不需要输入排放清单[19], 但会受到观测数据时空代表性的限制[20]. ML运行速度快, 计算效率高[21], 尤其适用于多站点长期数据的分析[22, 23]. 近年来, 利用ML来识别O3前体物、气象要素等变量对O3影响的研究逐步发展起来. 有研究基于随机森林(random forest, RF)[24, 25]、多元线性回归(multiple linear regression, MLR)[25, 26]和深度卷积神经网络(convolutional neural network, CNN)[27]等ML方法对大气O3浓度进行模拟, 并呈现出良好性能. Shapley加法解释算法(Shapley additive explanations, SHAP)是近年来常用的一种探究O3生成关键驱动因素的方法. Wang等[14]利用SHAP算法对兰州地区O3生成敏感性进行分析, 发现减少VOCs可以降低O3浓度, 但是减少NOx反而导致O3浓度增加, 这意味着O3生成处于VOCs控制区. 另外, 目前基于ML的O3研究大多采用实测的VOCs总量或组分数据[28], 较少考虑VOCs在大气中的光化学消耗这一过程. Zhan等[29]校正光化学消耗的影响, 计算VOCs初始体积分数, 利用RF模型探讨了2014 ~ 2016年夏季北京城区O3生成的主要影响因素和O3-VOCs-NOx敏感性, 并与OBM模型进行比较, 发现ML与OBM所得结果接近, 均认为O3生成处于VOCs控制区.

本研究基于北京城区站点2020年4月1日至9月30日O3、VOCs、NOx、一氧化碳(CO)、风速(WS)、风向(WD)、相对湿度(RH)和温度(T)在线监测数据, 分析了O3及其前体物VOCs和NOx污染特征, 以及O3与前体物和气象要素的相关性. 利用RF对O3浓度进行模拟并评估其模拟效果, 并使用SHAP算法解释了每个特征变量对O3浓度的贡献. 利用RF通过多情景分析探讨O3-VOCs-NOx敏感性, 与OBM结果进行比较和验证, 旨在为O3-VOCs-NOx敏感性分析提供一种更为快速简洁的方法.

1 材料与方法 1.1 外场观测

本研究中O3及其前体物浓度和气象要素监测站点(BJ)位于北京市城区北部(116.42°E, 40.05°N, 图 1), 距离北京市中心约16 km, 周边主要为住宅区, 无明显的局地排放源, 代表城市大气环境. 观测时间为2020年4 ~ 9月, 这一时间段光照强、温度高, 有利于O3生成.

图 1 观测站点(BJ)位置 Fig. 1 Location of the observation site (BJ)

本研究中大气VOCs利用无制冷剂自动气相色谱系统(GC-FID/MS, Agilent 5975/7890, 美国)进行在线监测. 该系统由超低温制冷装置、VOCs采样和预浓缩系统、气相色谱系统(GC)组成. 环境空气通过采样管路进入包含双气路的预浓缩系统, 在超低温条件下(-110℃)富集VOCs, 加热解析后进入GC, 分别利用PLOT和DB-624色谱柱进行分离, 然后利用氢火焰离子化检测器(FID)和质谱检测器(MS)进行定量检测[30]. 观测VOCs物种包含57种非甲烷碳氢(29种烷烃、10种烯烃、1种炔烃和17种芳香烃), 时间分辨率为1 h. 所采用标气为商品化混合标气(1×10-6, CNEMC Mix, Linde SPECTRA Environmental Gases, 美国), 将其稀释为体积分数为0.5×10-9 ~ 8×10-9的标气以便建立标准曲线. 各VOC组分标准曲线的可决系数R2均高于0.99. 将低浓度标气重复测量7次, 计算出各VOC组分的方法检出限为0.003×10-9 ~ 0.01×10-9.

O3、NOx和CO分别使用紫外光度O3分析仪(49i, Thermo Scientific, 美国)、化学发光NO-NO2-NOx分析仪(42i, Thermo Scientific, 美国)和红外吸收光谱仪(48i, Thermo Scientific, 美国)进行测量;气象要素WD、WS、RH和T数据则由自动气象站(WXT520, Vaisala, 芬兰)测量.

1.2 光化学初始体积分数的计算

VOCs测量体积分数反映了排放、物理和化学过程的综合影响[31, 32]. 假设VOCs排放进入大气后先混合均匀, 再经历光化学消耗(与·OH的氧化反应), 则可以计算VOCs光化学初始体积分数[33]

(1)

式中, [VOCj]t和[VOCj]0分别为观测到的VOCs组分j体积分数和未经历光化学反应时的初始体积分数. kj为VOC组分j与·OH的反应速率常数[cm3·(molecule·s)-1], 数值来自文献[34]. [·OH]为·OH浓度平均值(molecule·cm-3), Δt为光化学反应时间(s). 在计算时将([·OH]×Δt)作为一个整体, 其通过两种VOC组分的比值计算得到, 公式如下:

(2)

式中, X和E分别为间/对-二甲苯和乙苯. 选择二者的原因是其相关性强(r = 0.93, P < 0.05), 表明其来源相近, 而且其化学活性有显著的差异.(X/E)t为测量到的X和E体积分数比值.(X/E)0为X和E未经历光化学反应时的初始体积分数比值, 通常根据光化学反应很弱时段(如夜间和清晨)(X/E)t计算得到. 有研究分别选择了夜间(X/E)t的最大值[33]和平均值[35]计算(X/E)0. 本研究考虑到夜间最大值可能会受到异常值影响, 而平均值则会导致计算的[·OH]×Δt出现较多负值, 结合(X/E)t的平均日变化[图 2(a)], 最终选取夜间(X/E)t的第85%百分位数作为(X/E)0(4.2). kXkE分别为间/对二甲苯和乙苯与·OH的反应速率常数, 数值为1.87×10-11 cm3·(molecule·s)-1和7.0×10-12 cm3·(molecule·s)-1[34].

图 2 观测期间(X/E)t平均日变化、初始和测量TVOCs散点图、测量和初始VOCs化学组成 Fig. 2 Diurnal variation pattern of (X/E)t, scatter plot of initial and measured TVOCs, chemical compositions of measured, and initial VOCs during the entire observation period

1.3 随机森林(RF)和SHAP算法 1.3.1 基于RF的O3模拟及交叉验证

RF是以决策树为基学习器构建的一种Bagging集成算法[36]. 本研究使用Python中机器学习工具箱scikit-learn库中的RandomForestRegressor函数来建立近地面O3浓度与可解释变量之间的关系. 选取的可解释变量包括:化学要素(VOCs、NOx、CO)和气象要素(WS、WD、RH、T). 构建RF时的关键参数包括决策树的数量(n_estimators)、决策树的最大深度(max_depth)和节点可分的最小样本数(min_samples_split). 本研究通过网格搜索的方法[37, 38]调整这些参数使O3模拟值和实测值的R2最高, 最终确定了n_estimators、max_depth和min_samples_split的取值分别是310、16和5, 其它RF参数设置为默认值. 在进行交叉验证时, 将归一化处理后的观测数据分为10个子集, 轮流交替选取其中一个子集作为测试数据, 其余9个子集作为训练数据. 利用决定系数(R2)、平均绝对误差(MAE)、平方根误差(RMSE)来评估模型性能.

设置了3种方案对O3浓度进行模拟(表 1中方案A ~ C). 3种方案选取的可解释变量中NOx、CO和气象要素保持一致, 差别在于VOCs. 方案A中选取了所有观测VOCs组分总的体积分数(TVOCs)作为一个特征变量, 而方案B和C中则分别选择各VOCs组分的测量体积分数和初始体积分数作为特征变量. 模拟时间均为2020年4 ~ 9月.

表 1 基于RF的O3模拟方案 Table 1 O3 simulation scheme based on RF

1.3.2 基于SHAP算法的特征变量贡献

SHAP是一种用于解释ML模型模拟结果的方法. 基于合作博弈论中的Shapley值, 为每个特征变量分配一个重要性值, 以解释各个特征变量的贡献[39]. 本研究使用python中shap库对表 1方案A、B和C中每个特征变量的贡献进行解释和量化. 通过创建shap.Explainer对象来构建SHAP解释器, 将RF模型和模型的训练数据传递给解释器. 最后, 使用解释器中的shap_values计算每个特征变量的SHAP值, 公式如下:

(3)

式中, O3(i)为RF模型模拟的O3浓度(样本i), O3(base)为O3模拟浓度的平均值, shap(xij)为特征变量j对O3(i)的贡献值. 当shap(xij)>0时, 表示特征变量j对O3(i)呈正贡献;shap(xij)<0时, 则特征变量j对O3(i)呈负贡献. SHAP值计算方法的详细介绍参见文献[40].

1.3.3 基于RF模型的多情景模拟

选取2020年4 ~ 9月VOCs数据完善的O3污染天[即O3日最大8 h滑动浓度平均值ρ(DMA-8h O3)大于160 μg·m-3或O3日最大小时浓度平均值ρ(DMA-1h O3)大于200 μg·m-3]. 07:00 ~ 19:00作为O3-VOCs-NOx敏感性分析时段(表 1方案D). 本研究考虑到VOCs初始体积分数校正了光化学消耗, 在最近的研究中采用了VOCs初始体积分数作为RF模型的特征变量进行O3-VOCs-NOx敏感性分析[29], 因此, 将VOCs初始体积分数作为方案D的特征变量之一. 方案D作为RF的训练集(即基准情景), 将特征变量NOx浓度和VOCs初始体积分数分别从基准情景平均值的0.5倍以0.05倍间隔上升至1.5倍, 模拟不同21×21个情景下DMA-8h O3, 并将其作为RF测试数据. 通过多情景分析建立DMA-8h O3与NOx和VOCs的等值线(即EKMA曲线), 进而判断O3-VOCs-NOx敏感性.

1.4 基于观测的盒子模型(OBM)

本研究所使用的OBM在Cardelino和Chameides开发的0维盒子模型[41]基础上将化学机制由CB04升级至CB05[7], 以O3及其前体物和气象条件的观测数据逐时浓度作为约束, 模拟近地面O3生成过程, 并计算O3生成速率[41]. OBM模拟时段与RF方案D保持一致, 即O3污染天的07:00 ~ 19:00. 以VOCs、O3、一氧化氮(NO)和CO, 以及T的小时均值作为约束. 通过与RF方案D中类似的多情景分析来得到EKMA曲线:以VOCs和NOx观测数据的平均值作为基础情景, 然后将其从0.5以0.05倍为间隔增至1.5倍, 模拟21×21个情景下DMA-8h O3, 得到EKMA曲线.

2 结果与讨论 2.1 O3及其前体物污染特征 2.1.1 O3及其前体物浓度水平及时间变化

图 3展示了2020年4 ~ 9月O3及其前体物浓度和气象要素的时间变化. 在观测期间, ρ(O3)的平均值为(86.1 ± 53.8)μg·m-3. ρ(DMA-8h O3)在44.3 ~ 281.0 μg·m-3之间, 平均值为(132.8 ± 45.9)μg·m-3, 其中有56 d超过160 μg·m-3. ρ(DMA-1h O3)在48.0 ~ 314.0 μg·m-3之间, 平均值为(150.5 ± 51.0)μg·m-3, 其中有30 d超过200 μg·m-3. O3污染天和非污染天Tρ(NOx)、测量φ(TVOCs)的平均值分别为(26.2 ± 5.3)℃和(21.7 ± 6.1)℃、(34.3 ± 24.4)μg·m-3和(32.0 ± 25.2)μg·m-3、(15.4 ± 7.7)×10-9和(13.3 ± 8.0)×10-9, 前者显著高于后者(2个独立样本t检验, P < 0.05).

图 3 观测期间WD、WS、T、RH、O3、CO、NO、NO2、测量VOCs和初始VOCs时间序列 Fig. 3 Time series of WD, WS, T, RH, O3, CO, NO, NO2, measuredVOCs, and initialVOCs

观测期间, 初始φ(TVOCs)和测量φ(TVOCs)的平均值分别为(19.4 ± 12.7)×10-9和(13.4 ± 7.9)×10-9, 前者显著高于后者(2个相关样本t检验, P < 0.05). 从二者的相关性分析也可以看出, 初始与测量φ(VOCs)的比值均大于1[图 2(b)]. 从化学组成来看, 测量φ(TVOCs)中的烷烃占比最高(70.2%), 其次是芳香烃(12.6%)、烯烃(10.7%)和炔烃(6.5%)[图 2(c)]. 初始φ(VOCs)中, 烯烃和芳香烃的体积分数占比分别增加至20.1%和22.4%, 而烷烃和炔烃体积分数占比则降低至52.8%和4.7%[图 2(d)]. 这表明光化学反应对活性强的烯烃和芳香烃体积分数有显著影响, 不考虑VOCs光化学消耗, 可能会低估高活性烯烃和芳香烃组分对O3生成的影响.

2.1.2 O3与化学要素和气象要素的相关性分析

图 4(a)展示了观测期间O3小时均值与NOx、TVOCs、CO、T、RH和WS小时值的相关性. 结果显示:O3T呈显著正相关, 其Pearson相关系数r为0.60(P < 0.01), 与RH呈显著负相关, r为-0.40(P < 0.01), 表明高浓度的O3通常伴随着高温低湿的气象条件[42, 43]. O3小时均值与NOx和TVOCs呈显著负相关, r分别为-0.52和-0.25(P < 0.01). 这是因为O3生成伴随着TVOCs和NOx的光化学消耗, 因此高浓度的O3通常出现在午后, 而NOx和TVOCs则在晚上和清晨出现高值(图 5).

图 4 观测期间O3与NOx、TVOCs、CO、T、RH和WS的Pearson相关性分析 Fig. 4 Pearson correlation analyses of O3 and NOx, TVOCs, CO, T, RH, and WS during the entire observation period

图 5 观测期间NOx、TVOCs、CO、RH、O3T的平均日变化特征 Fig. 5 Average diurnal variation patterns of NOx, TVOCs, CO, RH, O3, and T during the entire observation period

为了评估逐日的O3生成与化学要素和气象要素的关系, 本研究根据其平均日变化规律(图 5), 选取了15:00 ~ 17:00的O3T的平均值, 07:00 ~ 09:00的NOx、TVOCs、CO和RH平均值进行Pearson相关性分析[图 4(b)]. O3T呈显著正相关(r = 0.58, P < 0.01), 与TVOCs、NOx和CO也呈正相关(r为0.32 ~ 0.36, P < 0.01). 这表明清晨高浓度TVOCs、NOx和CO对当天O3生成具有促进作用.

2.2 基于RF的O3影响因素分析 2.2.1 RF模拟交叉验证

图 6展示了利用RF按照表 1中A ~ C这3种方案模拟的O3与实测值之间的比较. 红色和黑色的实线分别为O3模拟值和O3实测值的时间序列, 结果显示, 该模型模拟的O3与实测值的变化趋势具有一致性, R2、RMSE和MAE分别为0.70 ~ 0.73、23.70 ~ 26.73 μg·m-3和17.73 ~ 19.97 μg·m-3. 利用RF模拟O3的研究显示R2、RMSE和MAE分别为0.57 ~ 0.87、10.13 ~ 31.45 μg·m-3和14.49 ~ 28.45 μg·m-3[24, 44 ~ 48], 与以往研究所给出的性能评估指标相比, 本研究中的R2和RMSE处于中等, 表明RF对O3的模拟结果可接受.

图 6 RF模拟的O3与实测值的比较 Fig. 6 Comparisons of simulated and measured O3 values for RF

2.2.2 特征变量对O3浓度的贡献

为评估各个特征变量对O3模拟值的贡献, 计算了方案A ~ C的SHAP值(图 7). 图 7(a) ~ 7(c)中每个点代表一个样本, 颜色代表特征变量的数值(即特征值)的大小. 从图 7(d) ~ 7(e)中可以看出, 在方案A ~ C中, 对O3模拟值贡献(平均|SHAP值|)排在前4的特征变量分别是T、NOx、CO和RH, 但是不同特征变量的SHAP值正负存在差异. T和CO随着数值增加, 相应的SHAP值增加, 说明其对O3模拟值是正向影响. NOx和RH对O3模拟值有负向影响, 且随着NOx和RH数值的增加负向影响越显著.

图 7 各个特征变量的SHAP值 Fig. 7 SHAP values of each characteristic variable

在方案A中, TVOCs对O3模拟值贡献较低. 在方案B和C中因为采用VOCs组分数据, 因此可以分析不同组分对O3模拟值的贡献. 方案B和C, 对O3模拟值贡献较高的VOC组分相似, 排名靠前的是苯、苯乙烯、乙烷、乙炔和正丁烷等. 需要注意的是, 方案B和C所计算得到的一些VOCs组分的平均|SHAP值|[图 7(e) ~ 7(f)]甚至高于方案A中TVOCs的平均|SHAP值|[图 7(d)], 说明基于TVOCs来表征其对O3模拟的影响时可能会存在一定程度的低估, 这可能是因为将TVOCs作为一个特征变量来模拟O3可能会掩盖一些组分的信息.

2.3 O3-VOCs-NOx敏感性分析

在比较OBM与RF所给出的O3-VOCs-NOx敏感性之前, 评估了OBM和RF对污染天O3浓度的模拟效果. OBM模拟的O3浓度与实测值吻合较好, R2、一致性指数(IOA)[49]和RMSE分别为0.71、0.79和30.82 μg·m-3. 以VOCs初始体积分数作为RF特征变量模拟的污染天O3浓度与实测值的R2、RMSE和MAE分别为0.76、25.69 μg·m-3和19.80 μg·m-3, 表明RF能较好地模拟污染天的O3浓度. 进一步对两种方法模拟的DMA-8h O3浓度进行比较. 图 8展示了RF模型和OBM模拟的多情景下DMA-8h O3浓度相对误差, 具体的情景设置参见1.3.3节. 从图 8中可以看出, 两个模型给出的DMA-8h O3浓度较为接近, 其相对误差[(RF-OBM)/OBM]范围为0.07% ~ 35.40%, 平均值为11.71%. 另外, 越接近基准情景, RF模型和OBM模拟的DMA-8h O3浓度相对误差越低. 例如在0.8 ~ 1.2倍基准情景下(图 8中黑色框), DMA-8h O3浓度相对误差的范围为0.07% ~ 16.72%, 平均值为5.81%, 显著低于0.5 ~ 1.5倍基准情景下的平均相对误差.

图 8 RF模型和OBM模拟DMA-8h O3浓度相对误差 Fig. 8 Relative errors of simulated DMA-8h O3 concentration between the RF model and OBM

图 9比较了利用RF模型和OBM得到的O3污染天O3生成的EKMA曲线, 其中黑点表示模拟时段内VOCs体积分数和NOx浓度平均值, 即基准情景. RF结果显示, 仅减少VOCs体积分数时, DMA-8h O3浓度随之下降, 仅减少NOx浓度时, DMA-8h O3浓度不降反而上升, 表明O3生成处于VOCs控制区[图 9(a)]. 图 9(b)中减少NOx浓度或VOCs体积分数时DMA-8h O3浓度的变化情况与RF模型的结果基本一致, 结果也表明O3生成处于VOCs控制区. 说明RF模型进行O3-VOCs-NOx敏感性分析具有良好的效果. 尽管RF模型等机器学习方法不考虑化学过程, 但本研究发现通过与OBM的比较其也能取得较好的效果, 而且其计算速度快, 是O3-VOCs-NOx敏感性分析的一种重要的补充方法.

图 9 O3污染天DMA-8h O3浓度的EKMA曲线 Fig. 9 EKMA curves of DMA-8h O3 concentration during O3 pollution days

3 结论

(1)2020年4 ~ 9月在北京城区点的观测结果显示:ρ(DMA-8h O3)平均值为(132.8 ± 45.9)μg·m-3, 有56 d超过160 μg·m-3;O3污染天ρ(NOx)和φ(TVOCs)的平均值分别为(34.3 ± 24.4)μg·m-3和(15.4 ± 7.7)×10-9, 显著高于非污染天. 从小时浓度来看, O3T和CO呈显著正相关, 与NOx和TVOCs呈现显著负相关. 而从每日特定3 h平均值来看, O3T、TVOCs和NOx均呈显著正相关.

(2)设置了3种方案利用RF模型模拟O3, 模拟值与实测值吻合较好, R2、RMSE和MAE分别为0.70 ~ 0.73、23.70 ~ 26.73 μg·m-3和17.73 ~ 19.97 μg·m-3. SHAP值计算结果显示NOx和RH对O3有负向影响, 而VOCs和CO有正向影响. 对O3模拟值贡献较高的VOC组分是苯、苯乙烯、乙烷、乙炔和正丁烷等.

(3)选择O3污染天VOCs和NOx平均值作为基准情景, 以0.05倍为间隔设置0.5倍至1.5倍的21×21个情景. 利用RF模型模拟不同情景下DMA-8h O3浓度进而得到EKMA曲线, 结果表明O3生成处于VOCs控制区, 与OBM结果相一致. 这说明RF模型可以作为化学传输模型的重要补充方法用于O3-VOCs-NOx敏感性分析.

致谢: 本研究的数值计算得到了南京信息工程大学高性能计算中心的支持和帮助

参考文献
[1] Niu Z P, Duan Z Z, Wei J, et al. Associations of long-term exposure to ambient ozone with hypertension, blood pressure, and the mediation effects of body mass index: a national cross-sectional study of middle-aged and older adults in China[J]. Ecotoxicology and Environmental Safety, 2022, 242. DOI:10.1016/J.ECOENV.2022.113901
[2] Ou J M, Huang Z J, Klimont Z, et al. Role of export industries on ozone pollution and its precursors in China[J]. Nature Communications, 2020, 11(1). DOI:10.1038/s41467-020-19035-x
[3] Li H M, Yang Y, Jin J B, et al. Climate-driven deterioration of future ozone pollution in Asia predicted by machine learning with multi-source data[J]. Atmospheric Chemistry and Physics, 2023, 23(2): 1131-1145. DOI:10.5194/acp-23-1131-2023
[4] Ainsworth E A, Yendrek C R, Sitch S, et al. The effects of tropospheric ozone on net primary productivity and implications for climate change[J]. Annual Review of Plant Biology, 2012, 63: 637-661. DOI:10.1146/annurev-arplant-042110-103829
[5] 中华人民共和国生态环境部. 2020年中国生态环境状况公报[EB/OL]. https://www.mee.gov.cn/hjzl/sthjzk/zghjzkgb/202105/P020210526572756184785.pdf, 2023-01-01.
[6] Wang M, Chen W T, Zhang L, et al. Ozone pollution characteristics and sensitivity analysis using an observation-based model in Nanjing, Yangtze River Delta Region of China[J]. Journal of Environmental Sciences, 2020, 93: 13-22. DOI:10.1016/j.jes.2020.02.027
[7] Xu D N, Yuan Z B, Wang M, et al. Multi-factor reconciliation of discrepancies in ozone-precursor sensitivity retrieved from observation- and emission-based models[J]. Environment International, 2022, 158. DOI:10.1016/J.ENVINT.2021.106952
[8] Tan Z F, Lu K D, Dong H B, et al. Explicit diagnosis of the local ozone production rate and the ozone-NOx-VOC sensitivities[J]. Science Bulletin, 2018, 63(16): 1067-1076. DOI:10.1016/j.scib.2018.07.001
[9] Guo H, Chen K Y, Wang P F, et al. Simulation of summer ozone and its sensitivity to emission changes in China[J]. Atmospheric Pollution Research, 2019, 10(5): 1543-1552. DOI:10.1016/j.apr.2019.05.003
[10] Luo H H, Zhao K H, Yuan Z B, et al. Emission source-based ozone isopleth and isosurface diagrams and their significance in ozone pollution control strategies[J]. Journal of Environmental Sciences, 2021, 105: 138-149. DOI:10.1016/j.jes.2020.12.033
[11] 陆晓波, 王鸣, 丁峰, 等. 2020年和2021年南京城区臭氧生成敏感性和VOCs来源变化分析[J]. 环境科学, 2023, 44(4): 1943-1953.
Lu X B, Wang M, Ding F, et al. Changes in O3-VOCs-NOx sensitivity and VOCs sources at an urban site of Nanjing between 2020 and 2021[J]. Environmental Science, 2023, 44(4): 1943-1953.
[12] 钱骏, 徐晨曦, 陈军辉, 等. 2020年成都市典型臭氧污染过程特征及敏感性[J]. 环境科学, 2021, 42(12): 5736-5746.
Qian J, Xu C X, Chen J H, et al. Chemical characteristics and contaminant sensitivity during the typical ozone pollution processes of Chengdu in 2020[J]. Environmental Science, 2021, 42(12): 5736-5746. DOI:10.3969/j.issn.1000-6923.2021.12.030
[13] 孙晓艳, 赵敏, 申恒青, 等. 济南市城区夏季臭氧污染过程及来源分析[J]. 环境科学, 2022, 43(2): 686-695.
Sun X Y, Zhao M, Shen H Q, et al. Ozone formation and key VOCs of a continuous summertime O3 pollution event in Ji'nan[J]. Environmental Science, 2022, 43(2): 686-695.
[14] Wang L, Zhao Y, Shi J S, et al. Predicting ozone formation in petrochemical industrialized Lanzhou city by interpretable ensemble machine learning[J]. Environmental Pollution, 2023, 318. DOI:10.1016/J.ENVPOL.2022.120798
[15] Cheng Y, Huang X F, Peng Y, et al. A novel machine learning method for evaluating the impact of emission sources on ozone formation[J]. Environmental Pollution, 2023, 316. DOI:10.1016/J.ENVPOL.2022.120685
[16] Beddows A V, Kitwiroon N, Williams M L, et al. Emulation and sensitivity analysis of the community multiscale air quality model for a UK ozone pollution episode[J]. Environmental Science & Technology, 2017, 51(11): 6229-6236.
[17] Wang M, Shao M, Chen W, et al. A temporally and spatially resolved validation of emission inventories by measurements of ambient volatile organic compounds in Beijing, China[J]. Atmospheric Chemistry and Physics, 2014, 14(12): 5871-5891. DOI:10.5194/acp-14-5871-2014
[18] Tang X, Zhu J, Wang Z F, et al. Improvement of ozone forecast over Beijing based on ensemble Kalman filter with simultaneous adjustment of initial conditions and emissions[J]. Atmospheric Chemistry and Physics, 2011, 11(24): 12901-12916. DOI:10.5194/acp-11-12901-2011
[19] 侯墨, 蒋小梅, 赵文鹏, 等. 2021年夏季新乡市城区臭氧超标日污染特征及敏感性[J]. 环境科学, 2023, 44(5): 2472-2480.
Hou M, Jiang X M, Zhao W P, et al. Ozone pollution characteristics and sensitivity during the ozone pollution days in summer 2021 of Xinxiang City[J]. Environmental Science, 2023, 44(5): 2472-2480.
[20] 伏志强, 戴春皓, 王章玮, 等. 长沙市夏季大气臭氧生成对前体物的敏感性分析[J]. 环境化学, 2019, 38(3): 531-538.
Fu Z Q, Dai C H, Wang Z W, et al. Sensitivity analysis of atmospheric ozone formation to its precursors in summer of Changsha[J]. Environmental Chemistry, 2019, 38(3): 531-538.
[21] Feng R, Zheng H J, Zhang A R, et al. Unveiling tropospheric ozone by the traditional atmospheric model and machine learning, and their comparison: a case study in Hangzhou, China[J]. Environmental Pollution, 2019, 252: 366-378. DOI:10.1016/j.envpol.2019.05.101
[22] Zheng H, Kong S F, He Y, et al. Enhanced ozone pollution in the summer of 2022 in China: the roles of meteorology and emission variations[J]. Atmospheric Environment, 2023, 301. DOI:10.1016/J.ATMOSENV.2023.119701
[23] 蔡旺华. 运用机器学习方法预测空气中臭氧浓度[J]. 中国环境管理, 2018, 10(2): 78-84.
Cai W H. Using machine learning method for predicting the concentration of ozone in the air[J]. Chinese Journal of Environmental Management, 2018, 10(2): 78-84.
[24] Zhan Y, Luo Y Z, Deng X F, et al. Spatiotemporal prediction of daily ambient ozone levels across China using random forest for human exposure assessment[J]. Environmental Pollution, 2018, 233: 464-473. DOI:10.1016/j.envpol.2017.10.029
[25] Fan K, Dhammapala R, Harrington K, et al. Development of a machine learning approach for local-scale ozone forecasting: application to Kennewick, WA[J]. Frontiers in Big Data, 2022, 5. DOI:10.3389/FDATA.2022.781309
[26] Han H, Liu J, Shu L, et al. Local and synoptic meteorological influences on daily variability in summertime surface ozone in Eastern China[J]. Atmospheric Chemistry and Physics, 2020, 20(1): 203-222. DOI:10.5194/acp-20-203-2020
[27] Eslami E, Choi Y, Lops Y, et al. A real-time hourly ozone prediction system using deep convolutional neural network[J]. Neural Computing and Applications, 2020, 32(13): 8783-8797. DOI:10.1007/s00521-019-04282-x
[28] Kalbande R, Kumar B, Maji S, et al. Machine learning based quantification of VOC contribution in surface ozone prediction[J]. Chemosphere, 2023, 326. DOI:10.1016/J.CHEMOSPHERE.2023.138474
[29] Zhan J L, Liu Y C, Ma W, et al. Ozone formation sensitivity study using machine learning coupled with the reactivity of volatile organic compound species[J]. Atmospheric Measurement Techniques, 2022, 15(5): 1511-1520. DOI:10.5194/amt-15-1511-2022
[30] Wang M, Zeng L M, Lu S H, et al. Development and validation of a cryogen-free automatic gas chromatograph system (GC-MS/FID) for online measurements of volatile organic compounds[J]. Analytical Methods, 2014, 6(23): 9424-9434. DOI:10.1039/C4AY01855A
[31] 姚青, 韩素芹, 张裕芬, 等. 天津夏季郊区VOCs对臭氧生成的影响[J]. 环境科学, 2020, 41(4): 1573-1581.
Yao Q, Han S Q, Zhang Y F, et al. Effects of VOCs on ozone formation in the Tianjin suburbs in summer[J]. Environmental Science, 2020, 41(4): 1573-1581.
[32] 王玥, 魏巍, 任云婷, 等. 基于卫星遥感和地面观测的人为源VOCs区域清单多维校验[J]. 环境科学, 2021, 42(6): 2713-2720.
Wang Y, Wei W, Ren Y T, et al. Multidimensional verification of anthropogenic VOCs emissions inventory through satellite retrievals and ground observations[J]. Environmental Science, 2021, 42(6): 2713-2720.
[33] 胡君, 王淑兰, 吴亚君, 等. 北京怀柔O3污染过程初始VOCs浓度特征及来源分析[J]. 环境科学研究, 2019, 32(5): 766-775.
Hu J, Wang S L, Wu Y J, et al. Characteristics and source analysis of initial mixing ratio of atmospheric VOCs during an ozone episode in Huairou, Beijing[J]. Research of Environmental Sciences, 2019, 32(5): 766-775.
[34] 吴方堃, 王跃思, 安俊琳, 等. 北京奥运时段VOCs浓度变化、臭氧产生潜势及来源分析研究[J]. 环境科学, 2010, 31(1): 10-16.
Wu F K, Wang Y S, An J L, et al. Study on concentration, ozone production potential and sources of VOCs in the atmosphere of Beijing during Olympics period[J]. Environmental Science, 2010, 31(1): 10-16.
[35] 罗瑞雪, 刘保双, 梁丹妮, 等. 天津市郊夏季的臭氧变化特征及其前体物VOCs的来源解析[J]. 环境科学, 2021, 42(1): 75-87.
Luo R X, Liu B S, Liang D N, et al. Characteristics of ozone and source apportionment of the precursor VOCs in Tianjin suburbs in summer[J]. Environmental Science, 2021, 42(1): 75-87.
[36] Breiman L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32. DOI:10.1023/A:1010933404324
[37] Ma R M, Ban J, Wang Q, et al. Random forest model based fine scale spatiotemporal O3 trends in the Beijing-Tianjin-Hebei region in China, 2010 to 2017[J]. Environmental Pollution, 2021, 276. DOI:10.1016/J.ENVPOL.2021.116635
[38] 姚红岩, 施润和. 基于周边站点优化选取的随机森林PM2.5小时浓度预测研究[J]. 环境科学学报, 2021, 41(4): 1565-1573.
Yao H Y, Shi R H. Research on hourly PM2.5 concentration prediction of random forest based on optimal selection of surrounding stations[J]. Acta Scientiae Circumstantiae, 2021, 41(4): 1565-1573.
[39] Ghahremanloo M, Choi Y, Lops Y. Deep learning mapping of surface MDA8 ozone: the impact of predictor variables on ozone levels over the contiguous United States[J]. Environmental Pollution, 2023, 326. DOI:10.1016/J.ENVPOL.2023.121508
[40] 董佳奇, 胡冬梅, 闫雨龙, 等. 基于可解释性机器学习的城市O3驱动因素挖掘[J]. 环境科学, 2023, 44(7): 3660-3668.
Dong J Q, Hu D M, Yan Y L, et al. Revealing driving factors of urban O3 based on explainable machine learning[J]. Environmental Science, 2023, 44(7): 3660-3668.
[41] Cardelino C A, Chameides W L. An observation-based model for analyzing ozone precursor relationships in the urban atmosphere[J]. Journal of the Air & Waste Management Association, 1995, 45(3): 161-180.
[42] 王雨燕, 杨文, 王秀艳, 等. 淄博市城郊臭氧污染特征及影响因素分析[J]. 环境科学, 2022, 43(1): 170-179.
Wang Y Y, Yang W, Wang X Y, et al. Characteristics of ozone pollution and influencing factors in urban and suburban areas in Zibo[J]. Environmental Science, 2022, 43(1): 170-179.
[43] 刘建, 吴兑, 范绍佳, 等. 前体物与气象因子对珠江三角洲臭氧污染的影响[J]. 中国环境科学, 2017, 37(3): 813-820.
Liu J, Wu D, Fan S J, et al. Impacts of precursors and meteorological factors on ozone pollution in Pearl River Delta[J]. China Environmental Science, 2017, 37(3): 813-820.
[44] 刘玉, 蔡秋亮, 佟磊, 等. 海陆风对宁波东南滨海郊区大气臭氧变化特征及预测的影响[J]. 环境科学学报, 2023, 43(4): 27-39.
Liu Y, Cai Q L, Tong L, et al. Influence of sea-land breeze on the variation characteristics and prediction of ozone in the suburban coastal atmosphere of southeast Ningbo[J]. Acta Scientiae Circumstantiae, 2023, 43(4): 27-39.
[45] 何琰, 林惠娟, 曹舒娅, 等. 城市臭氧污染特征与高影响气象因子: 以苏州为例[J]. 环境科学, 2023, 44(1): 85-93.
He Y, Lin H J, Cao S Y, et al. Characteristics of ozone pollution and high-impact meteorological factors in urban cities: a case of Suzhou[J]. Environmental Science, 2023, 44(1): 85-93.
[46] 赵楠, 卢毅敏. 中国地表臭氧浓度估算及健康影响评估[J]. 环境科学, 2022, 43(3): 1235-1245.
Zhao N, Lu Y M. Estimation of surface ozone concentration and health impact assessment in China[J]. Environmental Science, 2022, 43(3): 1235-1245.
[47] Lyu Y, Ju Q R, Lv F M, et al. Spatiotemporal variations of air pollutants and ozone prediction using machine learning algorithms in the Beijing-Tianjin-Hebei region from 2014 to 2021[J]. Environmental Pollution, 2022, 306. DOI:10.1016/J.ENVPOL.2022.119420
[48] 丁愫, 陈报章, 王瑾, 等. 基于决策树的统计预报模型在臭氧浓度时空分布预测中的应用研究[J]. 环境科学学报, 2018, 38(8): 3229-3242.
Ding S, Chen B Z, Wang J, et al. An applied research of decision-tree based statistical model in forecasting the spatial-temporal distribution of O3 [J]. Acta Scientiae Circumstantiae, 2018, 38(8): 3229-3242.
[49] He Z R, Wang X M, Ling Z H, et al. Contributions of different anthropogenic volatile organic compound sources to ozone formation at a receptor site in the Pearl River Delta region and its policy implications[J]. Atmospheric Chemistry and Physics, 2019, 19(13): 8801-8816.