环境科学  2023, Vol. 44 Issue (7): 3660-3668   PDF    
基于可解释性机器学习的城市O3驱动因素挖掘
董佳奇1, 胡冬梅1, 闫雨龙2, 彭林2, 张鹏辉1, 牛月圆1, 段小琳1     
1. 华北电力大学环境科学与工程学院, 资源环境系统优化教育部重点实验室, 北京 102206;
2. 北京交通大学环境学院, 北京 100044
摘要: 受前体物排放和气象条件等因素共同驱动, 大气臭氧(O3)已成为影响城市夏季环境空气质量的主要污染物. 目前物理化学机制驱动的演绎模型在进行O3污染解析时需要的模型参数众多, 运算时效性较差; 数据驱动的归纳模型运算效率高, 但存在可解释性差等问题. 通过建立可解释性数据驱动的Correlation-ML-SHAP模型, Correlation模块挖掘O3浓度关联影响因素, 机器学习ML模块耦合可解释性SHAP模块计算各驱动因素对O3浓度的影响贡献, 实现对驱动因素的定量解析, 并以晋城市2021年夏季O3污染过程为例开展应用研究. 结果表明, Correlation-ML-SHAP模型能够挖掘并利用强驱动因素模拟O3浓度和量化影响贡献, 其中ML模块采用XGBoost模型模拟准确度最佳. 2021年夏季晋城市O3污染强驱动因素为: 气温、日照强度、湿度和前体物排放水平, 贡献权重为: 32.1%、21.3%、16.5%和15.6%, 其中气温、日照强度和前体物排放水平贡献在污染天分别提升3.4%、1.2%和1.2%, 前体物排放贡献权重在污染天排名提升至第3. 各驱动因素对O3浓度呈非线性交互影响, 气温超24℃或湿度低于70%, 分别有94.9%和94.1%的概率对O3污染呈正贡献, 这种气象条件下ρ(NO2)超9 μg·m-3ρ(CO)超0.7 mg·m-3, 分别有94.9%和99.3%的概率对O3污染呈正贡献. 东南风风速低于5.8m·s-1或南风风速低于5.3m·s-1, 均对O3污染呈正贡献. 模型定量解析了各驱动因素对城市O3浓度的影响贡献, 可为夏季城市大气O3污染防控提供基础依据.
关键词: O3污染      驱动因素      影响贡献      可解释性      机器学习     
Revealing Driving Factors of Urban O3 Based on Explainable Machine Learning
DONG Jia-qi1 , HU Dong-mei1 , YAN Yu-long2 , PENG Lin2 , ZHANG Peng-hui1 , NIU Yue-yuan1 , DUAN Xiao-lin1     
1. Key Laboratory of Resources and Environmental System Optimization, College of Environmental Science and Engineering, North China Electric Power University, Beijing 102206, China;
2. School of the Environment, Beijing Jiaotong University, Beijing 100044, China
Abstract: Driven by precursor emissions, meteorological conditions, and other factors, atmospheric ozone (O3) has become the main pollutant affecting urban air quality in summer. The current deductive models driven by physical and chemical mechanisms require a large number of parameters for the analysis of O3 pollution, and the calculation timeliness is poor. The data-driven inductive models are efficient but have problems such as poor explanation. In this study, an explainable model of data-driven Correlation-ML-SHAP was established to reveal the strongly correlated influencing factors of O3 concentration. Additionally, the machine learning ML module coupled with the explainable SHAP module was used to calculate the contributions of driving factors to O3 concentration, so as to realize the quantitative analysis of driving factors. The O3 pollution process in the summer of 2021 in Jincheng City was used as an example to carry out the application research. The results showed that the Correlation-ML-SHAP model could reveal and use strong driving factors to simulate O3 concentration and quantify influence contribution, and the ML module used the XGBoost model to achieve the best simulation accuracy. Air temperature, solar radiation, relative humidity, and precursor emission level were the strong driving factors of O3 pollution in Jincheng City in summer 2021, and the contribution weights were 32.1%, 21.3%, 16.5%, and 15.6%. The contribution weights of air temperature, solar radiation, and precursor emission level increased by 3.4%, 1.2%, and 1.2% on polluted days, respectively, and the contribution weights of precursor emission level rose to third place on polluted days. Each driving factor had a nonlinear interaction effect on O3 concentration. When the air temperature exceeded 24℃, or the relative humidity was lower than 70%, there was a 94.9% and 94.1% probability of positive contribution to O3 pollution, respectively. Under such meteorological conditions, ρ(NO2) exceeded 9 μg·m-3, or ρ(CO) exceeded 0.7 mg·m-3, and there was a 94.9% and 99.3% probability of positive contribution to O3 pollution, respectively. The southeast wind speed was lower than 5.8 m·s-1, or the south wind speed was lower than 5.3 m·s-1, both of which contributed positively to O3 pollution. The model quantitatively analyzed the influence contribution of various driving factors on urban O3 concentration, which could provide a basis for the prevention and control of urban atmospheric O3 pollution in summer.
Key words: O3 pollution      driving factors      contribution      explanation      machine learning     

有研究表明, 受前体物排放[1~3]和气象条件[4~7]等因素共同驱动, 大气O3已成为影响城市夏季环境空气质量的主要污染物[8, 9]. 目前对于O3污染驱动因素的研究, 主要应用物理化学机制驱动的演绎模型[10, 11]和数据驱动的归纳模型[12, 13]. 其中CMAQ和WRF-Chem等应用相对较多. 张迎春等[14]采用CMAQ模型对成都市夏季O3进行模拟评估, 并采用情景分析法得出夏季O3对气象因子的灵敏度依次为: 气温、绝对湿度和大气压强. Hu等[15]利用WRF-Chem模拟四川盆地O3时空变化特征和传输路径. 但这些模型需要输入网格化排放清单和气象场等众多模型参数, 运算时效性较差[16]. 机器学习ML模型善于处理非线性问题, 运算效率高[17]. 蔡旺华[18]和马润美等[19]分别采用XGBoost和Random Forest模型预测O3浓度, 精确度较高. 但这些模型的可解释性差, 都较难定量解析各因素对O3的影响[20]. 近年来, 基于可解释性数据驱动模型, 学者们将机器学习ML模块耦合可解释性SHAP模块, 为模型的合理性验证和模拟数据的定量解析提供接口[21, 22]. ML-SHAP模型应用广泛, 如Xu等[23]采用XGBoost-SHAP解释驾驶行为和机动车排放水平的关系, 廖彬等[24]采用XGBoost-SHAP模型解释决定运动员身价的主要因素. XGBoost-SHAP模型在定量解析影响因素贡献方面已有一定应用, 但该类模型缺乏对各驱动因素和目标变量之间的关联性筛选和优化能力, 导致部分影响因素可解释性较差.

本研究建立可解释性数据驱动模型Correlation-ML-SHAP模型, Correlation模块挖掘O3浓度的关联影响因素, 优化数据组合, 提高模型可解释性. 机器学习ML模块耦合可解释性SHAP模块计算各驱动因素对O3浓度的贡献, 并以晋城市2021年夏季O3污染为例开展应用研究, 旨在为夏季城市大气O3污染防控提供基础依据.

1 材料与方法 1.1 改进的可解释性机器学习研究框架

Correlation-ML-SHAP研究方法耦合Correlation模块、ML模块和可解释性SHAP模块, 通过挖掘O3浓度关联影响因素, 实现对模型结果可解释性的优化. 以上3个模块分别用于时间关联性挖掘、O3浓度模拟和各驱动因素影响评估. 应用Correlation模块遍历不同时段驱动因素和模拟时段O3浓度的Pearson相关系数, 搜索O3浓度关联影响因素优化数据组合. 应用机器学习ML模块训练候选模型, 结合模型评价指标和可解释性SHAP特征图分别评估候选模型的精准度和可解释性, 确定最佳模型. 将优化数据组合和最佳模型输入可解释性SHAP模块计算任意时刻各驱动因素对O3浓度的影响贡献. 应用于定量解析O3浓度驱动因素和交互影响. 技术路线如图 1所示.

图 1 技术路线 Fig. 1 Technology roadmap

1.2 机器学习ML模块 1.2.1 模型训练

对于数据驱动的机器学习ML模型, 设O3污染数据集为{X}={xi1, xi2, xi3, …, xis, yi}.对于i时刻的O3浓度可由s个驱动因素输入候选机器学习ML模型计算得到[25]. 如公式(1):

(1)

式中, O3(i)i时刻O3浓度的模拟值(μg·m-3); α为候选ML模型的优化参数配置; f为候选的机器学习ML模型.

各驱动因素对夏季城市O3浓度的影响呈现非线性变化特征[26, 27]. 处理此类数据特征的主流ML模型包括XGBoost、Random Forest、Adaboost、Decision Tree和KNN[28~32]. 采用网格搜索验证法优化以上候选模型的参数配置, 如表 1所示. 以XGBoost模型为例, n_estimator为弱学习器数量, 通过生成新的学习器拟合上一步结果的残差以逐步提高模拟精度; max_depth、reg_alpha和reg_lambda分别为树的最大深度以及L1和L2正则化项, 这些参数主要用于避免模型发生过拟合.

表 1 模型主要参数配置 Table 1 Configuration of the main parameters of the models

1.2.2 模型评估

为定量评价模型模拟结果的准确度, 分别采用平均值绝对误差(MAE)、均方根误差(RMSE)和决定系数(R2)对候选ML模型进行定量评价. 如公式(2)~(4):

(2)
(3)
(4)

式中, O3(i true)i时刻O3浓度的真实值(μg·m-3); O3(i)i时刻O3浓度的模拟值(μg·m-3). MAE和RMSE用于评价模拟值和真实值的差异, 两种指标越低越准确; R2用于评价回归性能, 取值越大效果越好. 表 2为候选的不同机器学习ML模型模拟结果的评估指标.

表 2 模型评价指标结果 Table 2 Model evaluation index results

KNN、Decision Tree和Adaboost模型模拟结果的准确度较低, 主要原因在于KNN对多维数据的回归和可解释性较差; Decision Tree和Adaboost模型易受异常数据干扰, 稳定性较弱. XGBoost和Random Forest模型模拟结果的准确度相对较高, 但由于Random Forest模型max_depth参数值较大, 导致模型复杂度高, 容易发生过拟合. 采用XGBoost模型时MAE、RMSE和R2这3项指标分别为15.4、21.7和0.82, 相比其它ML模型模拟结果的准确度最高, 原因在于该模型通过引入损失函数的二阶泰勒展开和正则项, 优化模型复杂度, 避免过拟合[33, 34].

1.3 可解释性SHAP模块

基于合作博弈中SHAP理论的归因分析方法, 计算机器学习ML模型中各驱动因素对O3(i)的边际贡献值, 结合SHAP可加性解释模型量化不同时刻各驱动因素的贡献大小[35], 计算方法如公式(5)~(7):

(5)
(6)
(7)

式中, O3(base)O3(i)的期望值(μg·m-3); shap(xi, j)为i时刻因素jO3(i)的贡献值(μg·m-3), 当shap(xi, j)>0时, 对O3(i)呈正贡献; shap(xi, j) < 0时, 对O3(i)呈负贡献; O3(M)为ML模型在子集M条件下的模拟值(μg·m-3); M为不包括因素j的特征子集; β(M)为特征子集M的权重.

环境中不同驱动因素对O3(i)的贡献权重不同, 定量解析因素jO3(i)的贡献权重, 可以通过计算因素j的SHAP特征重要性与全部因素重要性的比值得到[36]. 计算方法如公式(8)和公式(9):

(8)
(9)

式中, I(xj)为因素jO3(i)的贡献权重(%); α(xj)为因素j的SHAP特征重要性, 以因素j的|shap(xi, j)|均值计(μg·m-3), α(xj)取值越大, 因素jO3(i)的贡献权重越大.

环境中驱动因素通常在其他因素交互影响下共同驱动O3(i)变化, 分析O3(i)驱动因素的交互影响[37]. 计算方法如公式(10)~(12):

(10)
(11)
(12)

式中, shap(xi, xj)为因素ijO3(i)的交互影响值(μg·m-3), O3(M*)为ML模型在子集M*条件下的模拟值(μg·m-3); M*为不包括因素ij的特征子集; β*为特征子集M*的权重.

(a) 2021年各季节臭氧日最大8 h第90百分位数; (b)2021年各月臭氧日最大8 h第90百分位数; (c)2021年5~9月每小时O3浓度均值

2 结果与讨论 2.1 晋城市O3时间变化特征

晋城市作为“2+26”城市之一, 位于山西省东南部, 全境被山脊环绕形成盆地地形. 如图 2所示, 2021年臭氧日最大8 h第90百分位数[ρ(O3-8h)]为180 μg·m-3, 位居“2+26”城市倒数. ρ(O3-8h)呈“春夏高、秋冬低”分布, 即: 夏季(212 μg·m-3)>春季(172 μg·m-3)>秋季(153 μg·m-3)>冬季(96 μg·m-3). 其中5~9月是污染高发期, ρ(O3-8h)分别为185、225、192、179和177 μg·m-3. 2021年5~9月每小时O3浓度均值变化特征呈单峰分布, 07:00开始浓度持续升高, 12:00~18:00处于高值区. 主要原因可能是夏季昼间有利的气象条件促进光化学反应向O3生成方向进行[38~42].

(a)2021年各季节臭氧日最大8 h第90百分位数; (b)2021年各月臭氧日最大8 h第90百分位数; (c)2021年5~9月每小时O3浓度均值 图 2 晋城市2021年O3浓度时间变化特征 Fig. 2 Temporal variation characteristics of O3 concentration in Jincheng City in 2021

以晋城市2021年夏季O3污染过程为例, 应用建立的Correlation-ML-SHAP模型定量解析夏季O3污染驱动因素影响贡献.

2.2 影响O3的关联驱动因素挖掘

选取晋城市2021年夏季5~9月昼间07:00~18:00作为模拟时段. 收集O3、NO2、CO、PM10和PM2.5浓度的小时数据以及气温、湿度、日照强度、风向、风速、大气压和能见度小时数据作为O3污染数据集. 小时浓度数据来源于大气环境科学综合数据采集与共享平台(http://106.38.83.12:9002/ahpcp/login/index.html); 小时气象数据来源于国家气象科学数据中心(http://data.cma.cn/). 数据集中存在的部分异常、缺失值, 采用基于时间序列的拉格朗日插值法填充处理.

表 3所示, 应用Correlation-XGBoost-SHAP模型的Correlation模块, 遍历不同时段各驱动因素与模拟时段O3浓度之间的相关性系数, 得到关联因素为: 提前2 h的气温、日照强度、湿度以及同时刻的NO2、CO、大气压、风速和能见度, Pearson相关系数分别为0.777、0.770、-0.611、-0.548、-0.387、-0.346、0.326和0.331, 在0.01水平上显著相关. 数据特征方面, 气温、日照强度、湿度的相关性在提前2 h达到最大, 表明O3浓度变化滞后于上述特征. 姜峰等[43]在研究日照强度对O3浓度影响时也发现了这种关系. 可知应用数据驱动的方法对O3浓度进行模拟时, 模型可能更关注提前2 h的气温、日照强度和湿度变化.

表 3 驱动因素与O3浓度的相关性系数1) Table 3 Correlation coefficient between driving factors and O3 concentration1)

图 3所示, 由于XGBoost-SHAP模型缺乏对各驱动因素和O3浓度之间的时间关联性筛选和优化能力, 导致部分驱动因素的可解释性较差. 建立的Correlation-XGBoost-SHAP模型关注数据之间的时间关联性, 通过Correlation模块挖掘O3浓度的关联驱动因素, 优化数据组合, 使模型模拟结果的合理性得以验证和改善. 从模拟结果的可解释性来看, 该模型优化了影响O3浓度变化的驱动因素贡献特征, 如该模型的日照强度贡献排名提升至第2, 对O3污染呈正贡献. 从模拟结果的准确度来看, 该模型的MAE、RMSE和R2分别为15.4、19.8和0.85, 在XGBoost-SHAP模型的基础上准确度有所提高. 由此可知Correlation-ML-SHAP模型在解析影响O3污染的各驱动因素方面具备可行性, 其中ML模块采用XGBoost模型模拟准确度最佳.

(a)模型可解释性; (b)模型评价指标 图 3 优化数据组合的模型性能评估 Fig. 3 Model performance evaluation of optimized data composition

2.3 夏季O3污染驱动因素影响研究 2.3.1 驱动因素的贡献权重

应用Correlation-XGBoost-SHAP模型解析晋城市夏季O3污染因素. 如图 4所示, 通过可解释性SHAP模块公式(8)和公式(9)计算各驱动因素的贡献权重, 用NO2和CO对O3的贡献权重和代表前体物排放水平的贡献权重. 影响O3浓度变化的各驱动因素贡献权重依次为: 32.1%(气温)、21.3%(日照强度)、16.5%(湿度)、15.6%(前体物的排放水平)、8.5%(风向风速)和6.0%(其它). 气温、日照强度、湿度以及前体物对O3污染的贡献权重均高于传输扩散相关的风向风速, 表明晋城市夏季O3浓度变化主要受本地光化学反应生成影响. 其中前体物的排放贡献权重在污染天排名提升至第3, 其它驱动因素的贡献权重排名不变, 但贡献程度不同. 气温、日照强度和前体物排放水平的贡献权重在污染天分别为34.0%、21.9%和16.3%, 高于优良天3.4%、1.2%和1.2%; 湿度的贡献权重在污染天为14.3%, 低于优良天4.0%. 可知夏季城市O3浓度受气温和日照强度影响较大, 污染天前体物排放对O3浓度的影响也不容忽视.

图 4 晋城市夏季O3浓度的驱动因素贡献权重 Fig. 4 Contribution weights of driving factors for O3 concentration in Jincheng City in summer

2.3.2 驱动因素交互影响分析

通过Correlation-XGBoost-SHAP模型可解释性SHAP模块的交互值计算, 进一步探究各驱动因素对O3浓度变化的交互影响. 如图 5所示, 气象条件方面, 气温、日照强度和O3浓度呈非线性正相关, 随着日照强度的增强, 气温对O3污染的正贡献提升, 当气温超过24℃时在较强日照的交互影响下有94.9%的概率对O3污染呈正贡献; 湿度低于70%时有94.1%的概率对O3污染呈正贡献, 但超过70%后在低温的交互影响下对O3污染呈负贡献. 传输扩散方面, 东南风风速低于5.8m·s-1或南风风速低于5.3m·s-1时, 风速增加对O3污染的正贡献提升. 由此可知, 晋城市夏季O3污染受多方面的气象因素交互影响, 强日照条件下高温和低湿是引发O3污染的原因, 同时还受到东南部和南部区域的传输影响. 与周边城市临汾[44]、郑州[45]的O3污染条件基本一致. 前体物方面, NO2、CO和O3浓度的变化相近. 高温(≥24℃)且低湿(≤70%)的气象条件下, ρ(NO2)≥9 μg·m-3ρ(CO)≥0.7 mg·m-3, 分别有94.9%和99.3%的概率对O3污染呈正贡献.

散点为横坐标上因素j在其他因素共同驱动下对O3的贡献值; 色柱为产生交互影响的因素取值; (d)和(e)用虚线将反应条件加以划分: Ⅰ阶段为午后的光化学反应, Ⅱ阶段为日出后的光化学反应 图 5 晋城市夏季O3浓度的驱动因素交互影响 Fig. 5 Interaction of driving factors on O3 concentration in Jincheng City in summer

3 结论

(1) 基于可解释性数据驱动思想, 以城市O3污染过程为研究对象, 建立Correlation-ML-SHAP模型, 模型能够挖掘并利用强驱动因素模拟O3浓度和量化影响贡献, 其中机器学习ML模块采用XGBoost模型模拟准确度最佳, 模型可为夏季城市大气O3污染防控提供基础依据.

(2) 晋城市2021年夏季5~9月ρ(O3-8h)分别为185、225、192、179和177 μg·m-3. 影响夏季O3浓度的强驱动因素依次为气温、日照强度、湿度和前体物排放水平, 贡献权重分别为32.1%、21.3%、16.5%和15.6%.

(3) 气温、日照强度、前体物排放水平在污染天对O3浓度的贡献权重分别为34.0%、21.9%和16.3%, 相比优良天分别提升3.4%、1.2%和1.2%, 前体物排放贡献权重排名提升至第3.

(4) 各驱动因素对O3浓度呈非线性交互影响, 气温超24℃或湿度低于70%时分别有94.9%和94.1%的概率对O3污染呈正贡献, 这种气象条件下ρ(NO2)≥9 μg·m-3ρ(CO)≥0.7 mg·m-3, 分别有94.9%和99.3%的概率对O3污染呈正贡献. 东南风风速低于5.8m·s-1或南风风速低于5.3m·s-1, 均对O3污染呈正贡献.

参考文献
[1] 刘建, 吴兑, 范绍佳, 等. 前体物与气象因子对珠江三角洲臭氧污染的影响[J]. 中国环境科学, 2017, 37(3): 813-820.
Liu J, Wu D, Fan S J, et al. Impacts of precursors and meteorological factors on ozone pollution in Pearl River Delta[J]. China Environmental Science, 2017, 37(3): 813-820.
[2] Wang M, Chen W T, Zhang L, et al. Ozone pollution characteristics and sensitivity analysis using an observation-based model in Nanjing, Yangtze River Delta Region of China[J]. Journal of Environmental Sciences, 2020, 93: 13-22. DOI:10.1016/j.jes.2020.02.027
[3] 潘本锋, 程麟钧, 王建国, 等. 京津冀地区臭氧污染特征与来源分析[J]. 中国环境监测, 2016, 32(5): 17-23.
Pan B F, Cheng L J, Wang J G, et al. Characteristics and source attribution of ozone pollution in Beijing-Tianjin-Hebei Region[J]. Environmental Monitoring in China, 2016, 32(5): 17-23.
[4] 王玫, 郑有飞, 柳艳菊, 等. 京津冀臭氧变化特征及与气象要素的关系[J]. 中国环境科学, 2019, 39(7): 2689-2698.
Wang M, Zheng Y F, Liu Y J, et al. Characteristics of ozone and its relationship with meteorological factors in Beijing-Tianjin-Hebei Region[J]. China Environmental Science, 2019, 39(7): 2689-2698.
[5] 曹庭伟, 吴锴, 康平, 等. 成渝城市群臭氧污染特征及影响因素分析[J]. 环境科学学报, 2018, 38(4): 1275-1284.
Cao T W, Wu K, Kang P, et al. Study on ozone pollution characteristics and meteorological cause of Chengdu-Chongqing urban agglomeration[J]. Acta Scientiae Circumstantiae, 2018, 38(4): 1275-1284.
[6] 赵伟, 高博, 刘明, 等. 气象因素对香港地区臭氧污染的影响[J]. 环境科学, 2019, 40(1): 55-66.
Zhao W, Gao B, Liu M, et al. Impact of meteorological factors on the ozone pollution in Hong Kong[J]. Environmental Science, 2019, 40(1): 55-66.
[7] 余钟奇, 马井会, 毛卓成, 等. 2017年上海臭氧污染气象条件分析及臭氧污染天气分型研究[J]. 气象与环境学报, 2019, 35(6): 46-54.
Yu Z Q, Ma J H, Mao Z C, et al. Study on the meteorological conditions and synoptic classifications of O3 pollution in Shanghai in 2017[J]. Journal of Meteorology and Environment, 2019, 35(6): 46-54. DOI:10.3969/j.issn.1673-503X.2019.06.007
[8] 曾贤刚, 阮芳芳, 姜艺婧. 中国臭氧污染的空间分布和健康效应[J]. 中国环境科学, 2019, 39(9): 4025-4032.
Zeng X G, Ruan F F, Jiang Y J. Spatial distribution and health effects of ozone pollution in China[J]. China Environmental Science, 2019, 39(9): 4025-4032. DOI:10.3969/j.issn.1000-6923.2019.09.051
[9] 王莼璐, 王毅一, 史之浩, 等. 基于多源融合数据评估2014—2018年中国地表大气臭氧污染变化及其健康影响[J]. 大气科学学报, 2021, 44(5): 737-745.
Wang C L, Wang Y Y, Shi Z H, et al. Assessment of surface ozone pollution change and its health effect in China from 2014 to 2018 based on multi-source fusion data[J]. Transactions of Atmospheric Sciences, 2021, 44(5): 737-745.
[10] 马强, 陈天然, 陈翠红, 等. 嘉兴市大气污染特征及区域传输影响研究[J]. 环境污染与防治, 2020, 42(4): 467-471, 476.
Ma Q, Chen T R, Chen C H, et al. Study on the atmosphere pollution characteristics and regional transport in Jiaxing[J]. Environmental Pollution and Control, 2020, 42(4): 467-471, 476.
[11] 何涛, 乔利平, 徐圃青, 等. 常州市臭氧污染传输路径和潜在源区[J]. 中国环境监测, 2017, 33(4): 77-83.
He T, Qiao L P, Xu P Q, et al. Study of transport pathways and potential sources of ozone pollution in Changzhou[J]. Environmental Monitoring in China, 2017, 33(4): 77-83.
[12] Vu T V, Shi Z B, Cheng J, et al. Assessing the impact of clean air action on air quality trends in Beijing using a machine learning technique[J]. Atmospheric Chemistry and Physics, 2019, 19(17): 11303-11314. DOI:10.5194/acp-19-11303-2019
[13] Xing J, Zheng S X, Ding D, et al. Deep learning for prediction of the air quality response to emission changes[J]. Environmental Science & Technology, 2020, 54(14): 8589-8600.
[14] 张迎春, 付虹, 李迪, 等. 基于CMAQ模型分析成都市O3对气象因子的灵敏度[J]. 中国资源综合利用, 2021, 39(9): 31-35.
Zhang Y C, Fu H, Li D, et al. Sensitivity analysis of O3 to meteorological factors in Chengdu City based on CMAQ model[J]. China Resources Comprehensive Utilization, 2021, 39(9): 31-35.
[15] Hu J, Zhao T L, Liu J, et al. Exploring the ozone pollution over the western Sichuan Basin, Southwest China: the impact of diurnal change in mountain-plains solenoid[J]. Science of the Total Environment, 2022, 839. DOI:10.1016/j.scitotenv.2022.156264
[16] 胡冬梅. 基于时空数据挖掘的城市空气污染分析与预测[D]. 北京: 清华大学, 2018.
Hu D M. Research on the analysis and prediction of urban air pollution through spatio-temporal data mining[D]. Beijing: Tsinghua University, 2018.
[17] Reyes J M, Xu Y D, Vizuete W, et al. Regionalized PM2.5 community multiscale air quality model performance evaluation across a continuous spatiotemporal domain[J]. Atmospheric Environment, 2017, 148: 258-265.
[18] 蔡旺华. 运用机器学习方法预测空气中臭氧浓度[J]. 中国环境管理, 2018, 10(2): 78-84.
Cai W H. Using machine learning method for predicting the concentration of ozone in the air[J]. Chinese Journal of Environmental Management, 2018, 10(2): 78-84.
[19] 马润美, 张亚一, 班婕, 等. 基于随机森林模型的京津冀地区近地面臭氧站点浓度预测[J]. 环境与健康杂志, 2019, 36(11): 954-957.
Ma R M, Zhang Y Y, Ban J, et al. Prediction of ground ambient ozone site concentration in Beijing-Tianjin-Hebei Region based on random forest model[J]. Journal of Environment and Health, 2019, 36(11): 954-957.
[20] 纪守领, 李进锋, 杜天宇, 等. 机器学习模型可解释性方法、应用与安全研究综述[J]. 计算机研究与发展, 2019, 56(10): 2071-2096.
Ji S L, Li J F, Du T Y, et al. Survey on techniques, applications and security of machine learning interpretability[J]. Journal of Computer Research and Development, 2019, 56(10): 2071-2096.
[21] Lundberg S M, Erion G, Chen H, et al. From local explanations to global understanding with explainable AI for trees[J]. Nature Machine Intelligence, 2020, 2(1): 56-67.
[22] Ribeiro M T, Singh S, Guestrin C, et al. "Why should I trust you?": explaining the predictions of any classifier[A]. In: Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining[C]. San Francisco: ACM, 2016. 1135-1144.
[23] Xu J S, Saleh M, Hatzopoulou M. A machine learning approach capturing the effects of driving behaviour and driver characteristics on trip-level emissions[J]. Atmospheric Environment, 2020, 224. DOI:10.1016/j.atmosenv.2020.117311
[24] 廖彬, 王志宁, 李敏, 等. 融合XGBoost与SHAP模型的足球运动员身价预测及特征分析方法[J]. 计算机科学, 2022, 49(2): 195-204.
Liao B, Wang Z N, Li M, et al. Integrating XGBoost and SHAP model for football player value prediction and characteristic analysis[J]. Computer Science, 2022, 49(2): 195-204.
[25] 卢亚灵, 李勃, 范朝阳, 等. 空气质量预测模拟技术演变与发展研究[J]. 中国环境管理, 2021, 13(4): 84-92.
Lu Y L, Li B, Fan Z Y, et al. Evolution and development of air quality prediction and simulation technology[J]. Chinese Journal of Environmental Management, 2021, 13(4): 84-92.
[26] 易睿, 王亚林, 张殷俊, 等. 长江三角洲地区城市臭氧污染特征与影响因素分析[J]. 环境科学学报, 2015, 35(8): 2370-2377.
Yi R, Wang Y L, Zhang Y J, et al. Pollution characteristics and influence factors of ozone in Yangtze River Delta[J]. Acta Scientiae Circumstantiae, 2015, 35(8): 2370-2377.
[27] Diao L L, Bi X H, Zhang W H, et al. The characteristics of heavy ozone pollution episodes and identification of the primary driving factors using a generalized additive model (GAM) in an industrial megacity of northern China[J]. Atmosphere, 2021, 12. DOI:10.3390/atmos12111517
[28] 杨正理, 史文, 陈海霞, 等. 大数据背景下采用互信息与随机森林算法的空气质量预测[J]. 环境工程, 2019, 37(3): 180-185.
Yang Z L, Shi W, Chen H X, et al. Air quality forecasting with mutual information and random forests based on big[J]. Environmental Engineering, 2019, 37(3): 180-185.
[29] 徐旭冉, 涂娟娟. 基于决策树算法的空气质量预测系统[J]. 电子设计工程, 2019, 27(9): 39-42.
Xu X R, Tu J J. Air quality forecast system based on decision tree algorithm[J]. Electronic Design Engineering, 2019, 27(9): 39-42.
[30] 莫欣岳. 基于人工智能的空气质量决策支持系统建模研究[D]. 兰州: 兰州大学, 2021.
Mo X Y. Research on modeling of air quality decision support system based on artificial intelligence[D]. Lanzhou: Lanzhou University, 2021.
[31] Zhang Z C, Xu B, Xu W M, et al. Machine learning combined with the PMF model reveal the synergistic effects of sources and meteorological factors on PM2.5 pollution[J]. Environmental Research, 2022, 212. DOI:10.1016/j.envres.2022.113322
[32] 孙苏琪, 王式功, 罗彬, 等. 应用机器学习算法的成都市冬季空气污染预报研究[J]. 气象与环境学报, 2020, 36(2): 98-104.
Sun S Q, Wang S G, Luo B, et al. Air pollution forecast in winter based on machine learning method in Chengdu[J]. Journal of Meteorology and Environment, 2020, 36(2): 98-104.
[33] Chen T Q, Guestrin C. XGBoost: a scalable tree boosting system[A]. In: Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining[C]. San Francisco: ACM, 2016. 785-794.
[34] 康俊锋, 谭建林, 方雷, 等. XGBoost-LSTM变权组合模型支持下短期PM2.5浓度预测——以上海为例[J]. 中国环境科学, 2021, 41(9): 4016-4025.
Kang J F, Tan J L, Fang L, et al. Short-term PM2.5 concentration prediction based on XGBoost and LSTM variable weight combination model: a case study of Shanghai[J]. China Environmental Science, 2021, 41(9): 4016-4025.
[35] Lundberg S M, Lee S L. A unified approach to interpreting model predictions[A]. In: Proceedings of the 31st International Conference on Neural Information Processing Systems[C]. Long Beach: Curran Associates Inc., 2017. 4768-4777.
[36] 许博, 徐晗, 赵焕, 等. 机器学习耦合受体模型揭示驱动因素对PM2.5的影响[J]. 环境科学研究, 2022, 35(11): 2425-2434.
Xu B, Xu H, Zhao H, et al. Machine learning coupled with receptor model to reveal the effect of driving factors on PM2.5[J]. Research of Environmental Sciences, 2022, 35(11): 2425-2434.
[37] Hou L L, Dai Q L, Song C B, et al. Revealing drivers of haze pollution by explainable machine learning[J]. Environmental Science & Technology Letters, 2022, 9(2): 112-119.
[38] 张莹, 倪长健, 冯鑫媛, 等. 基于GAMs模型分析成都市气象因子交互作用对O3浓度变化的影响[J]. 环境科学, 2021, 42(11): 5228-5238.
Zhang Y, Ni C J, Feng X Y, et al. Interactive effects of the influencing factors on the changes of O3 concentrations based on GAMs model in Chengdu[J]. Environmental Science, 2021, 42(11): 5228-5238.
[39] 黄小刚, 邵天杰, 赵景波, 等. 基于GAM模型的西安市O3浓度影响因素解析[J]. 环境科学, 2020, 41(4): 1535-1543.
Huang X G, Shao T J, Zhao J B, et al. Influencing factors of ozone concentration in Xi'an based on generalized additive models[J]. Environmental Science, 2020, 41(4): 1535-1543.
[40] 花丛, 江琪, 迟茜元, 等. 我国中东部地区2015—2020年夏半年PM2.5和臭氧复合污染气象特征分析[J]. 环境科学研究, 2022, 35(3): 650-658.
Hua C, Jiang Q, Chi X Y, et al. Meteorological characteristics of air combined pollution in central and Eastern China in the summer half years of 2015-2020[J]. Research of Environmental Sciences, 2022, 35(3): 650-658.
[41] 薛莲, 徐少才, 孙萌, 等. 气象要素及前体物对青岛市臭氧浓度变化的影响[J]. 中国环境监测, 2017, 33(4): 179-185.
Xue L, Xu S C, Sun M, et al. Effect of meteorological factors and precursors on the change of ambient air ozone concentrations in Qingdao[J]. Environmental Monitoring in China, 2017, 33(4): 179-185.
[42] 张晓, 张艳品, 钤伟妙. 石家庄市主城区臭氧污染特征及气象成因分析[J]. 环境科学研究, 2021, 34(2): 245-253.
Zhang X, Zhang Y P, Qian W M. Characteristics of ozone pollution and its meteorological factors in Shijiazhuang urban area[J]. Research of Environmental Sciences, 2021, 34(2): 245-253.
[43] 姜峰, 王福伟. 夏季城市臭氧浓度变化规律分析[J]. 环境与可持续发展, 2016, 41(1): 62-64.
Jiang F, Wang F W. Analysis of the changes of urban ozone concentration in summer[J]. Environment and Sustainable Development, 2016, 41(1): 62-64.
[44] 宋晓伟, 郝永佩, 朱晓东, 等. 临汾市臭氧污染变化特征、气象影响及输送源分析[J]. 中国环境科学, 2022, 42(8): 3626-3634.
Song X W, Hao Y P, Zhu X D, et al. Variations in ozone pollution and their meteorological influences and transmission sources in Linfen City of China[J]. China Environmental Science, 2022, 42(8): 3626-3634.
[45] 王旭东, 尹沙沙, 杨健, 等. 郑州市臭氧污染变化特征、气象影响及输送源分析[J]. 环境科学, 2021, 42(2): 604-615.
Wang X D, Yin S S, Yang J, et al. Characteristics, meteorological influences, and transport source of ozone pollution in Zhengzhou City[J]. Environmental Science, 2021, 42(2): 604-615.