环境科学  2017, Vol. 38 Issue (1): 22-32   PDF    
基于GAM模型分析影响因素交互作用对PM2.5浓度变化的影响
贺祥1,2,3,4,5 , 林振山1,3,4,5     
1. 南京师范大学地理科学学院, 南京 210023;
2. 凯里学院旅游学院, 贵州 凯里 556011;
3. 江苏省地理信息资源开发与利用协同创新中心, 南京 210023;
4. 江苏省地理环境演化国家重点实验室培育建设点, 南京 210023;
5. 虚拟地理环境教育部重点实验室(南京师范大学), 南京 210023
摘要: 对南京市2013~2015年PM2.5及影响因素的时间变化序列,运用广义可加模型(GAM)分析影响因素交互作用对PM2.5浓度变化的影响.结果表明,PM2.5及影响因素都基本服从正态分布类型,影响因素间具较强相关性,其中气温、气压和水汽压间具有显著相关性.PM2.5浓度变化的单因素GAM模型中,所有影响因素均通过显著性检验,其中SO2、CO、NO2等影响因素的模型拟合度较优,方程解释度较高;PM2.5浓度变化的多因素GAM模型中SO2、CO、NO2、O3、平均降雨量(PRE)、平均风速(WIND)和相对湿度(RHU)等影响因素对PM2.5浓度变化解释率为73.9%,对其变化具有显著性影响;通过多因素对PM2.5浓度变化影响效应的诊断分析,得到SO2、NO2和WIND与PM2.5浓度变化呈线性关系,CO、O3、PRE和RHU与PM2.5浓度变化呈非线性关系;在影响因素交互作用对PM2.5浓度变化影响的GAM模型中,SO2与CO、PRE、RHU间交互作用,CO与NO2、O3、PRE、WIND、RHU间交互作用,以及NO2与WIND、PRE、RHU间交互作用,都在P < 0.01(或P < 0.05)水平下显著影响PM2.5浓度变化;大气污染物SO2、CO及NO2分别与气象等其它因素的交互作用对PM2.5浓度变化产生最主要影响作用;通过对影响因素交互作用GAM模型可视化三维图分析,定量研究了影响因素交互作用对PM2.5浓度变化的影响特征.结论表明,运用GAM模型,能够定量化分析影响因素交互作用对PM2.5浓度变化的影响,研究方法具有一定创新性,对PM2.5浓度污染与控制研究具有重要意义.
关键词: GAM模型      PM2.5浓度变化      影响因素      交互作用      南京市     
Interactive Effects of the Influencing Factors on the Changes of PM2.5 Concentration Based on GAM Model
HE Xiang1,2,3,4,5 , LIN Zhen-shan1,3,4,5     
1. College of Geography Science, Nanjing Normal University, Nanjing 210023, China;
2. Institute of Tourism, Kaili University, Kaili 556011, China;
3. Jiangsu Center for Collaborative Innovation in Geographical Information Resource Development and Application, Nanjing 210023, China;
4. State Key Laboratory Cultivation Base of Geographical Environment Evolution (Jiangsu Province), Nanjing 210023, China;
5. Key Laboratory of Virtual Geographic Environment (Nanjing Normal University), Ministry of Education, Nanjing 210023, China
Abstract: In this paper, the generalized additive model (GAM) was introduced to analyze the interactive effects of the influencing factors on the change of PM2.5 concentration during 2013-2015 in Nanjing city.The results showed as follows:PM2.5 and its influencing factors appeared to follow normal distribution.There were strong correlations among the influencing factors, especially among the temperature (TEM), pressure (PRS) and water vapor pressure (VAP).For the single influencing factor GAM models of PM2.5 concentration, all influencing factors passed the significance test.Moreover, the equation fitting degrees of SO2, CO, and NO2 were much higher.In the multiple influencing factors GAM models of PM2.5 concentration, the contribution of the SO2, CO, NO2, O3, precipitation (PRE), wind and relative humidity (RHU) to the change of PM2.5 concentration was 73.9% with significant impacts on the change of PM2.5 concentration.Based on the diagnostic analysis of the effect of multi factors on the change of PM2.5 concentration, there were linear relationship between PM2.5 and SO2, NO2 and wind, and non-linear relationship between PM2.5 and CO, O3, PRE and RHU.The GAM models, which considered the interaction of SO2 respectively with CO, PRE and RHU, the interaction of CO respectively with NO2, O3, PRE, Wind and RHU, and the interaction of NO2 respectively with Wind、PRE and RHU, all passed the significance test (P < 0.01 or P < 0.05).The interaction of SO2, CO and NO2 respectively with other factors such as meteorological factors had the most important influence on the change of PM2.5 concentration.At last, through the visualized three-dimensional map of the GAM models considering the interaction of the influencing factors on the PM2.5 concentration, the interactive effects of the influencing factors on PM2.5 concentration were quantitatively modeled.Our results demonstrated that GAM could be used to quantitatively analyze the interactive effect of the influencing factors on the change of PM2.5 concentration.Therefore, the research method is innovative and important for PM2.5 pollution and control.
Key words: GAM model      the change of PM2.5 concentration      influencing factors      interaction      Nanjing City     

国内外学者对PM2.5浓度变化展开了大量研究,主要包括对PM2.5污染来源、 扩散与传输[1~3],污染特征及灰霾等级评价[4, 5],PM2.5扩散模型及预测[6, 7],PM2.5对人体健康与环境的影响[8~10],PM2.5与空气污染物、 气象要素的相关性[11~13] 等多方面进行研究. 对PM2.5影响因素的研究,Querol等[14]对西班牙PM2.5时空变化及影响因素进行了探究,苗蕾等[15]对北京市PM2.5浓度变化与气象条件的关系进行研究,李松等[16]综合GIS对贵阳冬季PM2.5污染时空特征及驱动因素进行了分析,王占山等[17]对北京市35个监测站PM2.5数据分析其时空分布特征及与前体物和大气氧化性的相关性关系进行研究. 同时,不少学者还运用数学模型方法研究PM2.5浓度变化影响因素,Briggs等[18]、 林巧莺等[19]、 Gelencsér等[20]和吴健生等[21]运用土地利用回归模型研究PM2.5影响要素及空间分布特征. Christakos等[22]运用贝叶斯最大熵(BME)映射方法研究PM2.5浓度的影响因素. Miskell等[23]运用密度测量和土地利用回归模型(LUR)识别关键控制环境PM2.5浓度的驱动因素. 安芳等[24]运用多元线性与多元非线性回归分析PM2.5浓度与扬尘地表、 地表覆盖等因素的相关性. 刘金培等[25]运用广义脉冲响应函数和方差分解方法,探讨大气污染物和气象因素对 PM2.5的驱动作用. 顾凯华等[26]分析了逆温、 相对湿度、 风向、 风速等气象要素对PM2.5浓度的驱动影响. 虽然以上学者从PM2.5污染源成分、 污染物扩散与稀释、 气象环境因素,应用GIS软件、 土地利用回归、 贝叶斯数学模型等多种方法,分析了PM2.5浓度时空变化的影响因素,但主要是从PM2.5浓度变化与影响因素之间的线性相关性进行研究. 目前,运用非线性模型、 方法探讨影响因素对PM2.5浓度变化的影响研究成果还非常少,从影响因素交互作用对PM2.5浓度变化影响的研究成果则更少.

PM2.5浓度与空气污染物、 气象要素等影响因素构成一个复杂的非线性动力系统,在时间域中存在多层次的尺度结构和局部变化的特征(Qian)[27],其时间序列也反映了PM2.5浓度与影响因素间线性与非线性相互作用与发展变化过程. Hastie等[28]提出的广义可加模型(GAM),是广义线性模型和可加模型的结合形式,是用一个连接函数来建立反应变量的期望与非参数形式的预测变量之间的关系. 它可应用于响应变量与解释变量之间的关系是非线性和非单调的数据分析[29]. 本研究运用GAM模型,构建PM2.5浓度变化与影响因素构成的非线性模型,从而深入探讨影响因素交互作用对PM2.5浓度变化的影响特征.

1 材料与方法 1.1 研究对象与数据来源

以南京市PM2.5浓度、 大气污染物及气象因子的时间序列为研究对象,通过对2013年2月~2015年6月间的大气污染物、 气象要素等指标对PM2.5浓度变化影响作用关系进行研究. 气象资料来源于中国气象数据网(http://data.cma.gov.cn/),选取南京市各气象台站日平均统计数据,主要包括气象要素指标平均降水量(PRE) (mm)、 平均气压(PRS)(hPa)、 平均风速(WIND) (m·s-1)、 平均气温(TEM)(℃)、 平均相对湿度(RHU) (%)及平均水汽压(VAP) (hPa)、 日照时数(SSD)(h)等指标因子. PM2.5浓度及空气质量监测指标数据来源于中国环境监测总站(http://www.cnemc.cn/),包括PM2.5(μg·m-3)、 CO(mg·m-3)、 O3(μg·m-3)、 SO2(μg·m-3)、 NO2(μg·m-3)等空气质量监测指标因子,数据由南京市所有空气质量监测站的平均值计算得到.

1.2 研究方法

广义可加模型(GAM)是由数据驱动而非统计分布模型驱动的非参数回归模型,可对部分解释变量进行线性拟合,对其他因子进行光滑函数拟合. 模型不需要预先设定参数模型,模型通过解释变量的平滑函数建立,能够自动选择合适的多项式.

Stone[30]第一次提出了传统可加模型,其形式为:

式中,a为截距,fi(Xi)中i=1,2,…为平滑函数,是针对于每个解释变量的任意单变量函数,满足Esi(Xi)=0. Hastie等[31]将可加模型应用到广义线性模型中,由此提出了广义可加模型:

式中,μ=E(Y/XlX2X3,…,Xp),g(μ)是连接函数; f1f2,…,fp是连接解释变量的平滑函数; Xp为解释变量; fp(Xp)是关于Xp的非指定类别的非参数函数,其估计方法有平滑样条法、 局部加权回归散点平滑法、 薄板平滑样条法,平滑参数的选择有交叉验证法、 广义交叉验证法等. 在该模型中,响应变量的分布不仅可以是正态分布,也可以是二项分布、 卡方分布等. 在GAM模型具体分析过程中,采用Rx64.3.3.0版R软件及mgcv、 DAAG等软件包,来源于统计计算的R软件工程网(https://www.r-project.org/).

2 结果与分析 2.1 解释变量预分析

以PM2.5浓度变化作为响应变量,首先对PM2.5浓度变化绘制频率直方图及密度分布曲线(图 1),根据其分布形态,初步设定PM2.5浓度变化是正态分布类型,同时对解释变量SO2、 CO、 NO2、 PRE、 PRS、 O3、 WIND、 TEM、 VAP、 RHU、 SSD绘制频率直方图及密度分布曲线(图 1),从图 1中可清晰了解到它们也基本符合正态分布类型,并可分析出每个解释变量的浓度值分布范围及变化趋势特征,其中WIND、 NO2、 CO、 O3、 SO2、 PRE等解释变量的浓度值分布趋势与PM2.5的分布基本一致,其余指标则与PM2.5浓度变化趋势的一致性较小. 因此,采用恒等联系函数作为连接函数,将解释变量通过线性组合的方式来联接服从正态分布的响应变量. 图 1中,横轴表示各解释变量实际监测数值,纵轴表示各变量的频率除以组距得到的概率密度,频率分布直方图中所有矩形面积之和为1,密度分布曲线与 x 轴之间的面积为1.

图 1 影响因素的频率分布直方图与密度分布曲线 Fig. 1 Frequency histogram and density curve of influencing factors

多重共线性是指线性回归模型中的解释变量之间存在高度相关关系而使模型估计失真或难以准确估计. 解释变量之间可能存在的共线性,可利用两个解释变量间Pearson相关系数来判别两者的相关性程度,如果解释变量间相关系数较大,则两个解释变量之间通常存在严重共曲线性关系,在模型构建时通常只选取其中一个变量作为解释变量. 由Pearson相关系数(表 1)可知,VAP与TEM的相关系数0.914,VAP与PRS的相关系数0.855,在P<0.01水平下显著相关. 所有驱动因素中,VAP与TEM的相关性最高,这与水汽压大小与蒸发速率有密切关系,而蒸发速率在水分供应一定的条件下,主要受温度控制的实际情况吻合. 因此,可用气温指标代表水汽压指标,从而达到在构建多变量曲线模型时减小解释变量的共曲线性问题.

表 1 影响因素间Pearson相关系数1) Table 1 Pearson correlation coefficient among influencing factors

2.2 PM2.5与单影响因素的GAM模型分析

根据变量预分析的结果,将SO2、 CO、 NO2、 O3、 PRE、 PRS、 WIND、 TEM、 RHU、 SSD共10个影响因素作为解释变量,每次选择1个影响因素作为解释变量,PM2.5作为响应变量,采用样条平滑函数分别构建模型,并分析每个解释变量对响应变量的影响显著性及模型的拟合优度(表 2). 结果表明:所有影响因素均在P<0.01水平下对PM2.5浓度变化影响显著,表明各影响因素单独作为PM2.5浓度变化解释变量具有统计学意义; SO2、 CO、 NO2对PM2.5浓度变化影响的模型解释率较高(34.9%-64.3%),调整判定系数较大(0.346-0.639),表明这3个影响因素与PM2.5浓度变化构建模型方程的拟合度较优; 其它影响因素对PM2.5浓度变化的解释率较低(4.36%-11.8%),调整判定系数值也较低(0.042-0.11),表明它们单独对PM2.5浓度变化影响的模型拟合优度较差,模型对PM2.5浓度变化的解释能力也较差. 虽然有部分影响因素独立构建对PM2.5影响的模型方程拟合度较差,解释率较低,但它们均通过显著性检验,均具有统计学意义.

表 2 PM2.5浓度与单影响因素的GAM模型假设检验结果 Table 2 GAM model hypothesis test results between PM2.5 concentration and single influencing factors

当自由度值为1时,函数为线性方程,表明影响因素与响应变量PM2.5间具有某种线性关系; 当自由度大于1,表示函数是非线性曲线方程,影响因素与PM2.5浓度变化间具有某种非线性关系,且值越大,非线性关系越显著. 结果表明,WIND(自由度值为1)与PM2.5浓度变化具有显著的线性关系; NO2、 SSD与PM2.5间也具有一定的非线性关系(自由度值在2左右),其它解释变量则与PM2.5间具有非常显著的非线性关系. 本研究结果表明,PM2.5浓度变化影响因素中,除了平均风速,其它指标均与PM2.5浓度变化表现出一定的非线性关系,所以PM2.5浓度变化是受多因素驱动影响的复杂非线性时间变化序列. 因此,采用GAM模型可以较好分析影响因素(解释变量)与PM2.5浓度(响应变量)间的非线性关系.

2.3 多影响因素GAM模型分析与多重共线性诊断

将单因素分析中有统计意义和经过显著性检验的SO2、 CO、 NO2、 PRE、 PRS、 O3、 WIND、 TEM、 RHU、 SSD等影响因素作为解释变量,将PM2.5作为响应变量,进行多影响因素与PM2.5浓度间的GAM模型构建拟合,模型同样采用恒等联系函数作为连接函数,平滑回归项采用样条平滑函数估计,模型拟合结果如表 3.

表 3 PM2.5浓度与多影响因素的GAM模型假设检验结果 1) Table 3 GAM model hypothesis test results between PM2.5 concentration and multi influencing factors

多因素分析表明,PRS、 TEM和SSD的P值均大于0.05,未通过在0.05水平下显著性检验,WIND在P<0.05水平下显著影响PM2.5浓度变化,其余驱动因素在P<0.01水平下显著影响PM2.5浓度变化. 模型调整判定系数0.743,方差解释率75.5%,表明模型拟合程度较高,通过显著性检验的7个影响因素对PM2.5浓度变化解释率较高. 因此,可以确定SO2、 CO、 NO2、 O3、 PRE、 RHU和WIND对PM2.5变化有显著影响关系.

单独因素分析有统计学意义的变量,如PRS、 TEM、 SSD等在进行多因素分析时,没有通过显著性检验,没有统计学意义,很可能是因为各因素间还存在共曲线问题(上述相关性分析可知气压、 气温和日照时长的相关性较为显著). 多重共线性使参数估计值的方差增大,如果方差膨胀因子(VIF)值越大,说明共线性越强. 通过多重共线性诊断,可以区分造成多重共线性的主要解释变量(表 4). 结果表明,平均气压与气温两个因素的共线性较为显著. 因此,PRS与TEM的多重共线性可能是造成它们与PM2.5浓度构建模型时无法通过统计学意义检验的原因之一. 在综合考虑统计学意义与多重共线性后,删除PRS、 TEM、 SSD这3个因素后,重新拟合模型(表 5). 模型调整判定系数0.73,解释率 73.9%,表明模型拟合程度较高,解释变量对PM2.5浓度变化解释率也较高; 模型方程中截距项与所有解释变量均通显著性检验,7个影响因素均在P<0.01水平下显著影响PM2.5浓度变化. 研究结果表明,SO2、 CO、 NO2、 PRE、 O3、 WIND、 RHU对PM2.5浓度变化影响具有统计学意义,与PM2.5浓度变化间具有显著线性或非线性关系.

表 4 影响因素多重共曲线性检验结果 Table 4 Results of multiple co-curve test of influencing factors

表 5 PM2.5浓度与多影响因素的GAM模型假设检验结果 1) Table 5 GAM model hypothesis test results of PM2.5 concentration and multi influencing factors

纵轴表示平滑函数值,括号中数字表示估计自由度,虚线表示可信区间上下限, 实线表示PM2.5浓度的平滑拟合曲线,横坐标表示解释变量的实测值 图 2 影响因素对PM2.5浓度变化的影响效应 Fig. 2 Effect of influencing factors on the variation of PM2.5 concentration

2.4 PM2.5浓度变化受多因素影响效应诊断与模型检验 2.4.1 影响因素对PM2.5浓度变化作用效应诊断

通过对多影响因素(解释变量)与PM2.5响应变量间建立GAM模型,获得解释变量的平滑回归函数,并得到影响因素对PM2.5浓度影响效应图(如图 2),图 2中虚线表示拟合可加函数的逐点标准差,即可信区间的上、 下限; 实线代表PM2.5浓度的平滑拟合曲线. 横坐标表示各解释变量的实测值,纵坐标表示解释变量对PM2.5浓度的平滑拟合值. 纵坐标括号数值代表估计自由度值. 结果表明,SO2与PM2.5间的相关性表现为线性关系,随着SO2浓度递增时,PM2.5浓度也单调递增. CO与PM2.5浓度变化表现为非线性关系,在小于约1.8 mg·m-3区间内,随着CO浓度增加,PM2.5浓度呈递增趋势; 当CO浓度大于1.8 mg·m-3时,PM2.5浓度呈快速波动增加特征. NO2浓度与PM2.5浓度间的相关性也呈现一定线性关系,NO2浓度递增时,PM2.5浓度也单调递增. O3与PM2.5浓度变化表现为非线性关系,当O3浓度小于约150μg·m-3时,PM2.5浓度表现为单调递增; 当O3浓度大于150 μg·m-3时,呈缓慢降低趋势,并在200 μg·m-3左右保持平稳. 降雨与PM2.5浓度变化表现为复杂非线性关系,但整体表现是随着降雨量增加,PM2.5浓度呈降低趋势. 相对湿度也与PM2.5浓度变化表现为非线性关系,在相对湿度小于50%时,PM2.5浓度变化很缓慢增加,当相对湿度在50%-80%之间,PM2.5浓度呈增加趋势,随相对湿度继续增加,PM2.5浓度表现为降低趋势. 平均风速与PM2.5浓度表现出线性关系,表现出随风速增加,PM2.5浓度没有明显降低变化的特征. 这是由于南京市全年平均风速在2.5m·s-1左右,该风速对地表PM2.5及其污染源的稀释与扩散能力非常弱,但却有利于大气污染物之间的混合.

2.4.2 模型交叉检验

在通过模型假设检验及多曲线共线性分析后得到的解释变量SO2、 CO、 NO2、 O3、 PRE、 RHU、 WIN等7个因素与PM2.5构建得到GAM模型的拟合优度较好,影响因素对PM2.5浓度变化的解释率较高. 同时,为了避免过拟合现象,采用10折交叉验证法对其建立的GAM模型的进行验证. 在给定GAM建模数据中,拿出9份数据进行建模型,留1份数据用刚建立的模型进行预报,并求部分样本的预报误差,记录它们的平方加和. 过程一直进行,直到所有的样本都被预报了一次而且仅被预报一次. 交叉验证方法可有效判别、 克服构建的GAM过拟合问题,验证结果如表 6图 3. 对其分析可知,7个解释变量均通过了P<0.01的显著性检验,10折平均的均方值为569,预测值与实测值的差值较小. 结果说明,GAM模型的拟合效果较好,准确度较高.

表 6 PM2.5浓度变化GAM模型的10折交叉验证 Table 6 The 10-fold cross-validation of GAM for PM2.5 concentration variation

图 3 PM2.5浓度10折交叉验证的预测值 Fig. 3 Predictive values of 10-fold cross-validation of PM2.5 concentration

2.5 影响因素交互作用对PM2.5浓度变化的影响

PM2.5浓度变化受多种影响因素的共同影响,各解释变量之间交互作用对PM2.5浓度变化会产生强烈影响效应. 通过将解释变量进行交互构建GAM模型,然后分析它们对PM2.5浓度变化的影响,有利于全面、 深入地认识影响因素对PM2.5浓度变化的影响作用. 通过对影响因素两两之间交互构建GAM建模,分析可知(表 7),仅SO2-WIN与O3-PRE交叉项的估计自由度接近于1,说明多数交叉项与PM2.5浓度变化有显著的非线性关系; 模型调整判定系数0.785,解释率82.1%,表明模型拟合程度较高,交互作用影响因素对PM2.5浓度变化解释率较高; 模型方程中SO2-CO、 SO2-PRE、 SO2-RHU、 CO-NO2、 CO-O3、 CO-PRE、 CO-RHU、 CO-WIND、 NO2-WIND、 NO2-PRE、 PRE-RHU等11交叉解释变量项均通过显著性检验,表明它们对在P<0.01和P<0.05水平显著影响PM2.5浓度变化. 结果表明,多数交叉项是以空气污染物质CO、 SO2、 NO2与气象要素间的交互作用,这也与PM2.5浓度变化主要受到空气污染物与气象要素的交互作用过程影响的特征吻合.

表 7 影响因素交互作用与PM2.5浓度的GAM模型假设检验结果 Table 7 GAM hypothesis test results between PM2.5 concentration and interaction of influencing factors

对通过显著性检验、 具有统计学意义的驱动因素交互模型进行可视化绘图(图 4),可分析响应变量PM2.5浓度在不同自变量维度的同时变化特征. 由图 4(a)可知,当SO2浓度较低时,随着CO浓度增加,PM2.5浓度快速增加; 当SO2浓度较高,CO浓度较低时,PM2.5浓度值较高; 随着SO2与CO浓度值均增加时,PM2.5浓度值也呈增加趋势特征. 由图 4(b)可知,在降雨量较小时,随着SO2浓度增加,PM2.5浓度呈增加趋势,但随着降雨量增加,PM2.5浓度呈波动降低特征; 当降雨量达约120 mm后,PM2.5浓度呈快速降低特征,这与SO2具有较强溶解于水汽能力的特征一致[32]. 由图 4(c)可知,当SO2浓度较低时,随着相对湿度的增加,PM2.5浓度基本没有变化,当相对湿度较小时,随着SO2浓度增加,PM2.5浓度快速增加; 当SO2浓度值一定时,相对湿度增加,PM2.5浓度仅有略微增加,并没有造成显著变化影响,结果表明,相对湿度与SO2的交互作用对PM2.5浓度变化影响较弱. 由图 4(d)可知,当NO2浓度较低时,随着CO浓度增加,PM2.5浓度快速增加,当CO浓度较低时,随着NO2浓度增加,PM2.5浓度呈缓慢增加; 随着CO与NO2浓度的增加、 交互作用,PM2.5浓度呈增加趋势. 由图 4(e)可知,当CO浓度较低时,随着O3浓度增加,PM2.5浓度呈波动小幅度增加; 当O3浓度较低时,随着CO浓度增加,PM2.5浓度呈快速增加特征; 随着CO与O3浓度增大、 交互作用,PM2.5浓度呈快速波动增大. 由图 4(f)可知,当CO浓度较低时,随着降雨量增加,PM2.5浓度呈波动降低趋势; 当降雨量较小时,随着CO浓度增加,PM2.5浓度呈波动快速增加; 当降雨量与CO浓度增加时,PM2.5浓度呈波动降低变化,当降雨量达150 mm后,PM2.5浓度呈明显降低趋势. 由图 4(g)可知,当CO浓度值较低时,随着相对湿度增加,PM2.5浓度变化较小; 当相对湿度值较低时,随着CO浓度增加,PM2.5浓度呈快速增加趋势; 随着CO浓度与相对湿度值增加、 交互作用,PM2.5浓度呈增加趋势,特别是CO浓度大于约2mg·m-3,RHU大于50%后,PM2.5浓度增加幅度更大. 由图 4(h)可知,当CO浓度较低时,随着平均风速的增加,PM2.5呈降低特征; 当平均风速较低时,随CO浓度增加,PM2.5浓度呈快速增加; 当风速与CO浓度增加、 交互作用,PM2.5浓度呈波动增加特征,结果说明风速不仅能使大气污染物稀释的扩散,从而使大气污染物浓度降低,在较低风速时也对污染物间的混合作用有显著影响,并造成PM2.5浓度增加,这也与刘大锰等[33]研究结论一致. 由图 4(i)可知,当NO2浓度较低时,随着降雨量增加,PM2.5浓度呈波动降低特征,且降雨量值越大,PM2.5浓度降低幅度越大; 当降雨量很小时,随着NO2浓度增加,PM2.5浓度呈波动增加趋势; 当NO2浓度与降雨量增加、 交互作用,PM2.5浓度则呈波动降低趋势特征,特别是降雨量达约150mm后,PM2.5浓度呈快速降低趋势. 由图 4(j)可知,随着NO2浓度与平均风速的增加,PM2.5浓度呈快速增加趋势,这表明当风速较低时,风速对NO2污染物的扩散与混合作用更加显著,更加有利于NO2通过二次化学反应形成PM2.5污染物质. 由图 4(k)可知,由于相对湿度与降雨具有显著正相关性,当降雨量与相对湿度值均增加时,表明此时降雨量远大于蒸发,空气湿度较大,PM2.5浓度呈波动降低趋势,且在降雨量达约120 mm后,PM2.5浓度呈快速降低趋势.

图 4 驱动因素对PM2.5浓度变化影响的三维效应图 Fig. 4 Three-dimensional effect graph of driving factors on the variation of PM2.5 concentration

本研究结果表明,通过两两影响因素交互作用的GAM模型能够有效定量分析响应变量PM2.5浓度变化特征. PM2.5浓度变化是受多因素同时综合影响作用,因此在以后工作为还可进一步研究、 构建3个及以上影响因素间的交互模型,分析解释变量对响应变量PM2.5浓度变化的影响过程与特征.

3 结论

(1) 对PM2.5浓度及影响因素时间序列数据预分析,它们都基本服从正态分布类型; 各影响因素间均具较强相关性,其中气温、 气压和水汽压间具有显著相关性,为降低多重共线性影响,删除VAP指标.

(2) 运用GAM模型,对每个影响因素与PM2.5浓度间进行拟合,均通过显著性检验,其中SO2、 CO、 NO2等影响因素与PM2.5浓度变化构建模型方程的拟合度最优,模型解释率较高. 将所有影响因素作为解释变量,PM2.5为响应变量构建综合模型,气压、 气温及日照时数未通过P<0.05水平下显著性检验; WIND在P<0.05水平下显著影响PM2.5浓度变化,其余影响因素在P<0.01水平下显著影响PM2.5浓度变化. 删除VAP、 PRS、 TEM和SSD因素后的GAM模型调整判定系数0.73,方差解释率73.9%,表明模型拟合程度较高,SO2、 CO、 NO2、 PRE、 O3、 WIND、 RHU等影响因素构成的模型对PM2.5浓度变化解释率较高,对PM2.5变化有显著影响关系.

(3) 对GAM综合模型中各因素对PM2.5浓度变化影响效应的诊断分析得到,SO2、 NO2及WIND等影响因素均与PM2.5浓度变化基本呈线性关系,其中SO2与NO2表现为单调递增关系; 虽然WIND与PM2.5浓度也表现出线性关系,但随着风速增加PM2.5浓度变化不明显,这与南京市全年平均风速属于轻微风级密切相关. CO、 O3、 PRE和RHU对PM2.5浓度变化影响均是呈显著非线性. 通过10折交叉验证,7个解释变量也均通过了P<0.01的显著性检验,预测值与实测值的差值较小,结果说明GAM模型的拟合效果较好,准确度较高.

(4) 通过GAM模型分析影响因素交互作用对PM2.5浓度影响,得到模型方程的调整判定系数0.785,解释率82.1%,模型拟合程度较优,影响因素交互作用对PM2.5浓度变化解释率较高. 其中SO2与CO、 PRE、 RHU的交互作用,CO与NO2、 O3、 PRE、 RHU、 WIND的交互作用,以及NO2与WIND、 PRE、 RHU交互作用,都在P<0.01(或P<0.05)水平下显著影响PM2.5浓度变化. 结果表明,PM2.5浓度变化的主要污染物来源SO2、 CO及NO2,它们分别与气象要素等其它因素交互作用,对PM2.5浓度变化产生最主要、 复杂的非线性影响. 因此,通过影响因素交互作用对PM2.5浓度变化构建GAM模型,可定量预测、 分析影响因素间的交互作用对PM2.5浓度变化的影响特征.

参考文献
[1] 李莉, 安静宇, 严茹莎. 基于细颗粒物来源追踪技术的2013年12月上海市严重污染过程中PM2.5的源贡献分析[J]. 环境科学, 2015, 36(10) : 3543–3553. Li L, An J Y, Yan R S. Source contribution analysis of the fine particles in Shanghai during a heavy haze episode in December, 2013 based on the particulate matter source apportionment technology[J]. Environmental Science, 2015, 36(10) : 3543–3553.
[2] Gehrig R, Buchmann B. Characterising seasonal variations and spatial distribution of ambient PM10 and PM2.5 concentrations based on long-term Swiss monitoring data[J]. Atmospheric Environment, 2003, 37(19) : 2571–2580. DOI: 10.1016/S1352-2310(03)00221-8
[3] 薛文博, 付飞, 王金南, 等. 中国PM2.5跨区域传输特征数值模拟研究[J]. 中国环境科学, 2014, 34(6) : 1361–1368. Xue W B, Fu F, Wang J N, et al. Numerical study on the characteristics of regional transport of PM2.5 in China[J]. China Environmental Science, 2014, 34(6) : 1361–1368.
[4] Sawant A A, Na K, Zhu X N, et al. Chemical characterization of outdoor PM2.5 and gas-phase compounds in Mira Loma, California[J]. Atmospheric Environment, 2004, 38(33) : 5517–5528. DOI: 10.1016/j.atmosenv.2004.06.038
[5] 古金霞. 天津市区PM2.5污染特征及灰霾等级评价方法研究[D]. 天津:南开大学, 2010. Gu J X. The contaminative characters of PM2.5 and method of haze grade estimation in Tianjin[D]. Tianjin:Nankai University, 2010. http://cdmd.cnki.com.cn/Article/CDMD-10055-1011044999.htm
[6] 陈军, 高岩, 张烨培, 等. PM2.5扩散模型及预测研究[J]. 数学的实践与认识, 2014, 44(15) : 16–27. Chen J, Gao Y, Zhang Y P, et al. Study on the diffusion model and forecast of PM2.5 pollution[J]. Mathematics in Practice and Theory, 2014, 44(15) : 16–27.
[7] 刘杰, 杨鹏, 吕文生, 等. 基于气象因素的PM2.5质量浓度预测模型[J]. 山东大学学报(工学版), 2015, 45(6) : 76–83. Liu J, Yang P, Lv W S, et al. Prediction models of PM2.5 mass concentration based on meteorological factors[J]. Journal of Shandong university (Engineering Science), 2015, 45(6) : 76–83.
[8] Dockery D W, Pope C A, Xu X P, et al. An association between air pollution and mortality in six U.S. cities[J]. New England Journal of Medicine, 1993, 329(24) : 1753–1759. DOI: 10.1056/NEJM199312093292401
[9] 殷永文, 程金平, 段玉森, 等. 上海市霾期间PM2.5、PM10污染与呼吸科、儿呼吸科门诊人数的相关分析[J]. 环境科学, 2011, 32(7) : 1894–1898. Yin Y W, Cheng J P, Duan Y S, et al. Correlation analysis between the PM2.5, PM10 which were taken in the hazy day and the number of outpatient about breathing sections, breathing sections of pediatrics in Shanghai[J]. Environmental Sciences, 2011, 32(7) : 1894–1898.
[10] 谢元博, 陈娟, 李巍. 雾霾重污染期间北京居民对高浓度PM2.5持续暴露的健康风险及其损害价值评估[J]. 环境科学, 2014, 35(1) : 1–8. Xie Y B, Chen J, Li W. An Assessment of PM2.5 related health risks and impaired values of Beijing residents in a consecutive high-level exposure during heavy haze days[J]. Environmental Science, 2014, 35(1) : 1–8.
[11] 赵晨曦, 王云琦, 王玉杰, 等. 北京地区冬春PM2.5和PM10污染水平时空分布及其与气象条件的关系[J]. 环境科学, 2014, 35(2) : 418–427. Zhao C X, Wang Y Q, Wang Y J, et al. Temporal and spatial distribution of PM2.5 and PM10 pollution status and the correlation of particulate matters and meteorological factors during winter and spring in Beijing[J]. Environmental Science, 2014, 35(2) : 418–427.
[12] Xie Y Y, Zhao B, Zhang L, et al. Spatiotemporal variations of PM2.5 and PM10 concentrations between 31 Chinese cities and their relationships with SO2, NO2, CO and O3[J]. Particuology, 2015, 20 : 141–149. DOI: 10.1016/j.partic.2015.01.003
[13] Tsai Y I, Kuo S C, Lee W J, et al. Long-term visibility trends in one highly urbanized, one highly industrialized, and two rural areas of Taiwan[J]. Science of the Total Environment, 2007, 382(2-3) : 324–341. DOI: 10.1016/j.scitotenv.2007.04.048
[14] Querol X, Alastuey A, Rodriguez S, et al. Monitoring of PM10 and PM2.5 around primary particulate anthropogenic emission sources[J]. Atmospheric Environment, 2001, 35(5) : 845–858. DOI: 10.1016/S1352-2310(00)00387-3
[15] 苗蕾, 廖晓农, 王迎春. 基于长时间序列的北京PM2.5浓度日变化及气象条件影响分析[J]. 环境科学, 2016, 37(8) : 2836–2846. Miao L, Liao X N, Wang Y C. Diurnal variation of PM2.5 mass concentration in Beijing and influence of meteorological factors based on long term date[J]. Environmental Science, 2016, 37(8) : 2836–2846.
[16] 李松, 罗绪强. 综合GIS的贵阳冬季PM2.5污染时空特征及驱动因素分析[J]. 灾害学, 2014, 29(4) : 63–68. Li S, Luo X Q. Study on spatiotemporal characteristics of PM2.5 pollutant and its driving factors using GIS technology in winter[J]. Journal of Catastrophology, 2014, 29(4) : 63–68.
[17] 王占山, 李云婷, 陈添, 等. 2013年北京市PM2.5的时空分布[J]. 地理学报, 2015, 70(1) : 110–120. Wang Z S, Li Y T, Chen T, et al. Spatial-temporal characteristics of PM2.5 in Beijing in 2013[J]. Acta Geographica Sinica, 2015, 70(1) : 110–120.
[18] Briggs D J, Collins S, Elliott P, et al. A mapping urban air pollution using GIS:a regression-based approach[J]. International Journal of Geographical Information Science, 1997, 11(7) : 699–718. DOI: 10.1080/136588197242158
[19] 林巧莺, 陈永山. 我国城市冬季PM2.5空间特征及其人为影响因子[J]. 生态与农村环境学报, 2015, 31(4) : 460–465. Lin Q Y, Chen Y S. Spatial variation of PM2.5 in cities in winter and anthropogenic influencing factors in China[J]. Journal of Ecology and Rural Environment, 2015, 31(4) : 460–465.
[20] Gelencsér A, May B, Simpson D, et al. Source apportionment of PM2.5 organic aerosol over Europe:primary/secondary, natural/anthropogenic, and fossil/biogenic origin[J]. Journal of Geophysical Research:Atmospheres, 2007, 112(D23). DOI: 10.1029/2006JD008094
[21] 吴健生, 廖星, 彭建, 等. 重庆市PM2.5浓度空间分异模拟及影响因子[J]. 环境科学, 2015, 36(3) : 759–767. Wu J S, Liao X, Peng J, et al. Simulation and influencing factors of spatial distribution of PM2.5 concentrations in Chongqing[J]. Environmental Science, 2015, 36(3) : 759–767.
[22] Christakos G, Serre M L. BME analysis of spatiotemporal particulate matter distributions in North Carolina[J]. Atmospheric Environment, 2000, 34(20) : 3393–3406. DOI: 10.1016/S1352-2310(00)00080-7
[23] Miskell G, Salmond J, Longley I, et al. A novel approach in quantifying the effect of urban design features on local-scale air pollution in central urban areas[J]. Environmental Science & Technology, 2015, 49(15) : 9004–9011.
[24] 安芳, 翟亮, 桑会勇, 等. 基于地理国情数据的PM2.5因子多元回归分析[J]. 测绘科学, 2015, 40(7) : 58–63. An F, Zhai L, Sang H Y, et al. Multiple regression analysis on PM2.5 impact factors based on geographic conditions monitoring data[J]. Science of Surveying and Mapping, 2015, 40(7) : 58–63.
[25] 刘金培, 汪官镇, 陈华友, 等. 基于VAR模型的PM2.5与其影响因素动态关系研究--以西安市为例[J]. 干旱区资源与环境, 2016, 30(5) : 78–84. Liu J P, Wang G Z, Chen H Y, et al. Dynamic relationship between PM2.5 and its influence factors in Xi'an city based on the VAR model[J]. Journal of Arid Land Resources and Environment, 2016, 30(5) : 78–84.
[26] 顾凯华, 史红仙, 张帅, 等. 上海崇明岛近三年PM2.5浓度变化特征与气象条件的关系[J]. 长江流域资源与环境, 2015, 24(12) : 2108–2116. Gu K H, Shi H X, Zhang S, et al. Variation characteristics of PM2.5 levels and the influence of meteorological conditions on Chongming island in Shanghai[J]. Resources and Environment in the Yangtze Basin, 2015, 24(12) : 2108–2116.
[27] Qian Z M, He Q C, Lin H M, et al. Association of daily cause-specific mortality with ambient particle air pollution in Wuhan, China[J]. Environmental Research, 2007, 105(3) : 380–389. DOI: 10.1016/j.envres.2007.05.007
[28] Hastie T, Tibshirani R. Generalized additive models[J]. Statistical Science, 1986, 1(3) : 297–310. DOI: 10.1214/ss/1177013604
[29] 贾彬, 王彤, 王琳娜, 等. 广义可加模型共曲线性及其在空气污染问题研究中的应用[J]. 第四军医大学学报, 2005, 26(3) : 280–283. Jia B, Wang T, Wang L N, et al. Concurvity in generalized additive models in study of air pollution[J]. Journal of the Fourth Military Medical University, 2005, 26(3) : 280–283.
[30] Stone C J. Additive regression and other nonparametric models[J]. The Annals of Statistics, 1985, 13(2) : 689–705. DOI: 10.1214/aos/1176349548
[31] Hastie T J, Tibshirani R J. Generalized additive models[M]. London: Chapman & Hall, 1990.
[32] 杨懂艳, 刘保献, 张大伟, 等. 2012~2013年间北京市PM2.5中水溶性离子时空分布规律及相关性分析[J]. 环境科学, 2015, 36(3) : 768–773. Yang D Y, Liu B X, Zhang D W, et al. Correlation, seasonal and temporal variation of water-soluble ions of PM2.5 in Beijing during 2012-2013[J]. Environmental Science, 2015, 36(3) : 768–773.
[33] 刘大锰, 黄杰, 高少鹏, 等. 北京市区春季交通源大气颗粒物污染水平及其影响因素[J]. 地学前缘, 2006, 13(2) : 228–233. Liu D M, Huang J, Gao S P, et al. The pollution level and influencing factors of atmospheric particulates from traffic in Beijing city during spring[J]. Earth Science Frontiers, 2006, 13(2) : 228–233.