2. 湖南科技大学地理空间信息技术国家地方联合工程实验室, 湘潭 411201;
3. 香港中文大学地理资源管理学系, 香港 999077;
4. 中南大学地理科学与信息物理学院地理信息系, 长沙 410083
2. National-local Joint Engineering Laboratory of Geo-spatial Information Technology, Hunan University of Science and Technology, Xiangtan 411201, China;
3. Geographic Resource Management Department, Chinese University of Hong Kong, Hong Kong 999077, China;
4. Department of Geo-informatics, School of Geosciences and Info-physics, Central South University, Changsha 410083, China
近年来, 我国大气污染的形势空前严峻, 以颗粒物为首要污染物的区域性污染事件频发.其中, 细颗粒物PM2.5不仅能显著地降低大气的能见度, 同时对人体呼吸系统与心血管系统造成严重损害, 受到了公众与政府的普遍关注[1].为了有效地开展PM2.5综合防治工作, 推动空气质量持续改善, 需要对PM2.5进行精准化的监测与分析[2, 3]. PM2.5时空分布特征及时空相关特征研究是精准化监测与分析中的主要内容之一, 时空分布特征主要是对PM2.5浓度在不同时间与空间位置上的差异性进行表达, 而时空相关特征用于描述PM2.5与其它地理环境要素间具有时空依赖的相关关系.
现有研究大多直接从各监测站点分析时空分布特征[3, 4], 然而这种方式难以识别PM2.5浓度变化区域聚集特征, 虽然部分学者采用行政区划或者监测站点类型对PM2.5浓度数据进行聚合操作[5, 6], 进而描述局部区域PM2.5浓度的时空分布特征, 但是考虑到同一行政区划或同类监测站点在不同位置上PM2.5浓度可能存在差异, 因此这种处理方式的合理性存在疑问.相关系数或比值法能够量化PM2.5与其它要素相关程度[7], 但是难以有效地揭示变量间的依赖关系, 虽然回归分析可对变量间的依赖关系进行建模, 但是土地利用回归不能处理空间异质性[8~10], 地理加权回归虽然顾及了变量间关系在空间上的异质性[11~13], 但在实际应用中, 这种依赖关系不仅随空间位置发生变化, 同时可能随时间发生改变.因此, 顾及时空异质性的回归分析模型更有助于揭示PM2.5浓度与其它要素间的时空依赖关系.
为此, 本文以北京市为研究区域, 首先采用地理空间聚类技术对北京市的PM2.5浓度的聚集模式进行识别, 从而探测北京市PM2.5浓度的时空分布特征; 然后从时空异质性的角度出发, 借助于地理时空加权回归模型来分析PM2.5与PM10浓度之间的时空依赖关系, 通过深入地了解北京市PM2.5污染特点, 以期为大气的防治提供有价值参考依据.
1 材料与方法 1.1 研究数据简介本文所用的数据集为北京市环保局公布的北京市35个空气质量监测数据, 监测站点分布如图 1所示.研究过程中主要采用PM2.5以及PM10的浓度数据, 数据的时间跨度为2014年3月至2015年2月, 时间粒度为小时.对于数据中缺失值, 采用时序线性插值的方法进行处理, 即:
![]() |
![]() |
图 1 北京市空气质量监测站点分布 Fig. 1 Distribution map of air quality monitors in Beijing |
式中,Xn为第n个时刻的缺失值, Xi与Xj分别为缺失前后(时刻i与j)的浓度值.
1.2 研究方法(1) 模糊C均值聚类
模糊C均值聚类(fuzzy-c-means, FCM)是建立一种对样本数据隶属度的不确定性分类描述[14, 15], FCM算法是通过优化目标函数的方式得到最终的聚类结果. Chu等[16]采用FCM对台湾地区的PM2.5的时空分布特征进行分析, 已证实该方法能够较好探测PM2.5浓度的时空分异模式, 因此, 本文采用该方法对北京地区的PM2.5浓度时空分布特征进行分析.
对于样本集Y={y1, y2, y3, …, yn}⊂Rn, FCM方法的平方误差准则Jm(U, u)可表示为:
![]() |
(1) |
式中, U={Uij}为模糊隶属度函数; Uij表示第j个数据对应于第i类的隶属度; v={vi}为聚类中心的集合; dij表示第j个样本yi到第i个聚类中心的距离; c为聚类的类别数(1<c<n); m为模糊加权指数, 通常设置为2.集合X={x1, x2, x3, …, xn}是n个待聚类的像素集合, 目标是通过迭代优化算法来使得目标函数Jm最小.
(2) 地理时空加权回归模型
地理加权回归模型(geographically weighted regression, GWR)是为了处理空间异质问题而对全局多元线性回归模型进行的拓展[17, 18], 将数据的地理坐标嵌入到模型之中, 建立空间位置变系数的回归模型. GWR通过位置点i和其它观测点之间的空间距离生成权重矩阵, 从而得到位置点i上模型的参数值.然而这一方法忽视了依赖关系可能存在的时间异质性, 即时空变量间的关系同时随空间与时间位置的不同而发生改变[19].为此, Huang等[20]提出了顾及时空异质性的地理时空加权回归模型(geographically temporally weighted regression, GTWR). GTWR模型的表达式为:
![]() |
(2) |
式中, yi与xik分别表示回归模型的因变量与自变量; β0(ui, vi, ti)与βk(ui, vi, ti)分别为时空位置(ui, vi, ti)上回归模型的常数项与系数项; εi是回归模型的随机误差项.回归系数的估计模型为:
![]() |
(3) |
式中, 权重W(ui, vi, ti)=diag(αi1, αi2, …, αin), 观测样本的数目为n.在权重矩阵中, 对角线元素αij(1≤j≤n)为时空位置i与j间的时空距离函数.为了平衡时间和空间对预测点的影响, 即考虑时间和空间的尺度效应的差异, GTWR采用一种三维的椭圆坐标系来定义时空距离, 进而确定时空权重矩阵.假定空间距离为dS与时间距离为dT, 则时空距离可定义为:
![]() |
(4) |
式中, ⊗可以表示为不同的运算符.若⊗表示为“+”, 时空距离dST则可以表示为dS和dT的线性结合, 即:
![]() |
(5) |
![]() |
(6) |
式中, λ和μ分别为度量时间和空间的平衡指数, 该指数是用于测度在空间和时间尺度系统中的距离.通过欧氏距离和高斯函数来构建距离模型.设τ为μ/λ的比例, 同时λ≠0, 则有:
![]() |
(7) |
通常设定λ=1来减少参数的数目, 并通过交叉验证优化参数μ的取值.
2 结果与讨论 2.1 PM2.5浓度的时空分布特征分析首先, 采用FCM聚类方法探测北京市PM2.5浓度季节性的时空分布特征.其中, 类间距离依据Ward方法, 而类内距离采用欧氏距离.为了识别最优簇的数目, 通过优化目标函数来确定类内的加权均方误差以及类间的划分度, 即计算不同聚类数目对应FCM的目标函数值, 依据函数的收敛性来选择最终的聚类结果.各季节不同聚类数目对应的FCM目标函数变化曲线如图 2所示.
![]() |
图 2 各季节FCM目标函数变化曲线 Fig. 2 Change curve of FCM objective function in each season |
由图 2可以发现, 不同季节的目标函数值变化曲线大致相似, 随着簇的数目增加, 目标函数值均是先单调递减, 而当数目增加到某个值时, 目标函数值趋于稳定.通常将此时聚类结果作为最终的划分结果, 与之对应簇的数目则选为最优聚类数.以春季为例, 簇的个数从2增加到5的过程中, 目标函数值显著降低, 随后的目标函数曲线趋于平稳, 因此, 春季的最优聚类数目选为5, 该数目对应的聚类结果作为春季最终聚类结果.同理, 可以确定其它季节聚类的最优数目.春、夏、秋、冬这4个季节最终聚类数目分别为5、4、7、7.此外, 目标函数值是样本点到簇类中心位置的平均距离, 其大小可以表示簇间的分异程度高低. 4个季节中聚类结果的函数目标值次序分别为:冬季(3061)>秋季(2210)>春季(1671)>夏季(1530), 由目标函数值的大小可知, 冬季的空间分异程度最高而夏季的分异程度最低, 即冬季的PM2.5区域性分异程度显著于高于夏季的PM2.5区域性分异程度.
在FCM聚类中, 簇中心值是对簇平均浓度水平的表征.由图 3可知, 各季节最大的簇中心值依次为96.45、75.41、141.23、178.17 μg·m-3, 中心值较大的簇出现在秋季与冬季, 这就意味着春夏季细颗粒物污染程度低于秋冬季.其原因可能是:夏季不稳定的气象条件易于细颗粒物的扩散与沉降, 同时, 已有研究证实, 植被覆盖率与PM2.5具有极强的相关性, PM2.5浓度受植被的影响, 植被覆盖率的增加使得春季与夏季浓度值相对较低[21].而在秋冬季节, 秸秆焚烧和燃煤取暖均使得悬浮细颗粒物浓度呈现迅速攀升的趋势, 静稳的气象状况更加不利于污染物浓度的降低.各季节最小的簇中心值依次为57.99、57.61、77.34、54.44 μg·m-3, 由此可计算各季节中簇中心值的极差分别38.46、17.80、63.89、123.73 μg·m-3.簇中心值的极差在秋冬季明显大于春夏季, 同时春夏季的聚类结果中包含5个左右的簇, 而秋冬季节则划分为7个簇, 综合表明春夏季节的细颗粒物浓度的变异低于秋冬季节.其原因可能是:春夏季节不稳定的气象条件弱化了区域地理因素对局部地区的环境污染影响, 使得春夏季节的分异较弱, 而秋冬季节的天气状况一般具有静稳特征, 同时细颗粒物浓度受区域地形影响更明显, 北京的西部和北部为山脉, 东南部为平原, 呈现为典型的“簸箕”状地形, 细颗粒物在偏南风或偏东风的输送作用下易在山前的平原地区汇聚, 造成市区污染物累积而浓度升高, 而在偏北风的输送作用下市区的细颗粒物容易扩散出去而浓度降低, 从而形成显著地时空分异特征.
![]() |
图 3 各季节PM2.5模糊C均值聚类结果 Fig. 3 FCM clustering results of PM2.5 concentrations in each season |
此外, 各季节中浓度较高的簇主要位于北京市的南部, 而浓度较低的簇则出现在北京市的北部地区.因而, 各季节PM2.5浓度空间分布较为相似, 大多情况下表现为北部浓度低、南部浓度高的特征, 且呈现阶梯性变化趋势, 即浓度由北向南部逐渐降低, 相邻的簇间浓度降低的量大致相同.空间分布的差异与北京市城市功能区规划有直接关系, 北部延庆县、怀柔区、密云县等构成的生态涵养发展区, 其污染程度最小; 首都功能核心区(海淀区)与城市功能拓展区(东城区、西城区等)污染程度相似, 处于中间水平; 南部丰台区、房山区、大兴区等构成的城市发展新区, 其PM2.5浓度相对较高.此外, 北京市的南部存在较多传统的城市工业, 区域间污染物的传输也是导致PM2.5浓度空间分布结构的差异原因之一.现有污染源解析研究对此已进行了论证, 如李璇等[22]发现2013年1月北京市PM2.5区域污染物排放河北与天津贡献分别为26%与4%, 并且污染主要出现在北京城六区与南部地区; 李云婷等[23]分析了2013年北京市不同方位PM2.5的背景值, 结果表明周边区域对北京市PM2.5背景浓度空间分布影响显著.
2.2 PM2.5与PM10间关系的时空变异特征分析采用GTWR模型对PM2.5与PM10间关系的时空变异特征进行分析.为了对GTWR模型的有效性进行评价, 分别选取普通最小二乘法(OLS)、地理加权回归(GWR)进行对比.在GWR与GTWR中, 该函数均选为高斯函数, 带宽选择则采用交叉验证的方法. 表 1列出了这3种模型在不同季节回归决定系数R2的取值.不难发现, OLS模型中PM10仅能确定PM2.5大约50%的变异, GWR中PM10可以解释PM2.5大约89%变异, 而考虑到时空异质性的GTWR模型可以解释PM2.5近95%的变异.因此, GTWR比GWR与OLS具有更好的拟合效果, 从而证明了GTWR比仅考虑空间异质性的GWR以及全局的OLS更有效.
![]() |
表 1 不同模型对不同季节数据回归的决定系数 Table 1 Deterministic coefficients of different regression models for different seasonal data |
表 2列出了GWR与GTWR两种模型总体诊断结果.与GWR模型的诊断结果相比, GTWR模型的拟合优度R2从0.88增加至0.96, 赤池信息准则AICc从5872降低到5737, 误差平方和也有显著地降低.因此, 在顾及时空异质性的条件下, GTWR模型能够更好地描述PM2.5与PM10间的关系, 故采用GTWR的回归结果对PM10与PM2.5的关系进行分析更为有效.
![]() |
表 2 GWR与GTWR模型的统计诊断 Table 2 Statistical diagnoses of GWR and GTWR |
通过GTWR分析得到不同季节的PM2.5与PM10的回归系数值后, 采用克里金对整个北京地区的回归系数进行插值.由于克里金插值需要满足空间平稳性要求, 因此, 采用二次趋势面提取空间非平稳特征后进行插值分析[24]. 图 4为北京地区的PM2.5和PM10回归系数分布.回归系数统计上反映了PM10浓度对PM2.5浓度的边际影响程度, 其本质上能够揭示PM10组成成分的结构变化特征.由于PM10中包含了PM2.5, 因而回归系数通常为小于1的正数, 当PM10结构中PM2.5的含量较大时, 此时PM10浓度与PM2.5浓度的变化相似, 较大的回归系数能够刻画这种关系, 反之, PM10中PM2.5的含量较小则对应于较小的回归系数[16].
![]() |
图 4 各季节PM2.5-PM10回归系数分布 Fig. 4 Map of PM2.5-PM10 regression coefficients in each season |
以季节为分析尺度, 可以发现回归系数在时空分布上存在一定的差异, 总体上表现两个特征:第一, 春季和夏季PM2.5-PM10相关性低于秋季和冬季PM2.5-PM10相关性, 即PM10浓度的变化与PM2.5浓度的变化在秋冬季具有较高的一致性, 秋冬季节PM2.5是PM10的主要组成部分; 第二, 北京市西北部PM2.5-PM10相关性高于东南部PM2.5-PM10相关性, 即通常PM10中PM2.5所占比率在北京市西北部高于东南部.根据北京区域划分, 北京西北部属于生态涵养区, 该区域内扬尘等大颗粒物会造成PM10激升的可能性很小, 同时氧化物的转换在生态涵养区占据一定比例.相比而言, 在北京南部等区域传输区, 该区域内扬尘、粉尘等大颗粒物会激升PM10在该区域内的含量, 同时PM2.5并未随之产生较大的浮动, 因此该区域内PM2.5在PM10中的占比低于北部生态涵养区.
3 结论(1) 模糊C均值聚类算法依据“簇内差异性尽可能小, 簇间差异性尽可能大”的原则, 将PM2.5浓度数据划分为不同的空间簇, 通过对簇内与簇间的统计特征进行分析, 能够量化PM2.5的空间分布特征.
(2) 通过模糊C均值聚类分析可知, 春夏季节PM2.5污染程度及空间变异程度均低于秋冬季节, 各季节PM2.5浓度均表现为北部浓度低、南部浓度高的空间分布特征.
(3) 相比于最小二乘回归与地理加权回归模型, 地理时空加权回归模型对PM2.5-PM10关系的解释能力更强, 说明了PM2.5与PM10之间不仅仅存在空间异质, 同时存在时间异质, 即关系随时空位置发生变化.
(4) 通过构建地理加权回归模型可以发现, 春夏季PM2.5-PM10相关性低于秋冬季PM2.5-PM10相关性; 各季节均表现为西北部PM2.5-PM10的相关性高于东南部PM2.5-PM10的相关性.
[1] |
吴健生, 王茜, 李嘉诚, 等. PM2.5浓度空间分异模拟模型对比:以京津冀地区为例[J]. 环境科学, 2017, 38(6): 2191-2201. Wu J S, Wang X, Li J C, et al. Comparison of models on spatial variation of PM2.5 concentration:a case of Beijing-Tianjin-Hebei Region[J]. Environmental Science, 2017, 38(6): 2191-2201. |
[2] |
孙艳丽, 刘永健, 刘承宪. 环境影响评价对环境空气细颗粒物PM2.5防治作用探析[J]. 沈阳建筑大学学报(自然科学版), 2013, 29(6): 1147-1152. Sun Y L, Liu Y J, Liu C X. Environmental impact assessment on ambient air fine particulate matter PM2.5 role of prevention[J]. Journal of Shenyang Jianzhu University (Natural Science), 2013, 29(6): 1147-1152. |
[3] | Wu J S, Zhu J, Li W F, et al. Estimation of the PM2.5 health effects in China during 2000-2011[J]. Environmental Science and Pollution Research, 2017, 24(11): 10695-10707. DOI:10.1007/s11356-017-8673-6 |
[4] |
杨复沫, 贺克斌, 马永亮, 等. 北京PM2.5浓度的变化特征及其与PM10、TSP的关系[J]. 中国环境科学, 2002, 22(6): 506-510. Yang F M, He K B, Ma Y L, et al. Variation characteristics of PM2.5 concentration and its relationship with PM10 and TSP in Beijing[J]. China Environmental Science, 2002, 22(6): 506-510. |
[5] |
赵晨曦, 王云琦, 王玉杰, 等. 北京地区冬春PM2.5和PMl0污染水平时空分布及其与气象条件的关系[J]. 环境科学, 2014, 35(2): 418-427. Zhao C X, Wang Y Q, Wang Y J, et al. Temporal and spatial distribution of PM2.5 and PM10 pollution status and the correlation of particulate matters and meteorological factors during winter and spring in Beijing[J]. Environmental Science, 2014, 35(2): 418-427. |
[6] |
王占山, 李云婷, 陈添, 等. 2013年北京市PM2.5的时空分布[J]. 地理学报, 2015, 70(1): 110-120. Wang Z S, Li Y T, Chen T, et al. Spatial-temporal characteristics of PM2.5 in Beijing in 2013[J]. Acta Geographica Sinica, 2015, 70(1): 110-120. |
[7] |
刘永林, 孙启民, 钟明洋, 等. 重庆市主城区PM2.5时空分布特征[J]. 环境科学, 2016, 37(4): 1219-1229. Liu Y L, Sun Q M, Zhong M Y, et al. Temporal and spatial distribution characteristics of PM2.5 in Chongqing urban areas[J]. Environmental Science, 2016, 37(4): 1219-1229. |
[8] |
焦利民, 许刚, 赵素丽, 等. 武汉PM2.5时空特征分析[J]. 环境科学与技术, 2015, 38(9): 70-74. Jiao L M, Xu G, Zhao S L, et al. Analyzing temporal and spatial variability of PM2.5 concentration in Wuhan[J]. Environmental Science & Technology, 2015, 38(9): 70-74. |
[9] | Hoek G, Beelen R, de Hoogh K, et al. A review of land-use regression models to assess spatial variation of outdoor air pollution[J]. Atmospheric Environment, 2008, 42(33): 7561-7578. DOI:10.1016/j.atmosenv.2008.05.057 |
[10] | Gillespie J, Beverland I J, Hamilton S, et al. Development, evaluation, and comparison of land use regression modeling methods to estimate residential exposure to nitrogen dioxide in a cohort study[J]. Environmental Science & Technology, 2016, 50(20): 11085-11093. |
[11] | Hu X F, Waller L A, Al-Hamdan M Z, et al. Estimating ground-level PM2.5 concentrations in the southeastern U.S. using geographically weighted regression[J]. Environmental Research, 2013, 121: 1-10. DOI:10.1016/j.envres.2012.11.003 |
[12] | Song W Z, Jia H F, Huang J F, et al. A satellite-based geographically weighted regression model for regional PM2.5 estimation over the Pearl River Delta region in China[J]. Remote Sensing of Environment, 2014, 154: 1-7. DOI:10.1016/j.rse.2014.08.008 |
[13] | Zhang T H, Liu G, Zhu Z M, et al. Real-time estimation of satellite-derived PM2.5 based on a semi-physical geographically weighted regression model[J]. International Journal of Environmental Research and Public Health, 2016, 13(10): 974. DOI:10.3390/ijerph13100974 |
[14] | Bezdek J C, Ehrlich R, Full W. FCM:the fuzzy c-means clustering algorithm[J]. Computers & Geosciences, 1984, 10(2-3): 191-203. |
[15] | Zhou K L, Yang S L. Exploring the uniform effect of FCM clustering:a data distribution perspective[J]. Knowledge-Based Systems, 2016, 96: 76-83. DOI:10.1016/j.knosys.2016.01.001 |
[16] | Chu H J, Huang B, Lin C Y. Modeling the spatio-temporal heterogeneity in the PM10-PM2.5 relationship[J]. Atmospheric Environment, 2015, 102: 176-182. DOI:10.1016/j.atmosenv.2014.11.062 |
[17] | Fotheringham A S, Brunsdon C, Charlton M. Geographically weighted regression[M]. Chichester, UK: John Wiley and Sons, 2002. |
[18] | Zhang H G, Mei C L. Local least absolute deviation estimation of spatially varying coefficient models:robust geographically weighted regression approaches[J]. International Journal of Geographical Information Science, 2011, 25(9): 1467-1489. DOI:10.1080/13658816.2010.528420 |
[19] | Fotheringham A S, Crespo R, Yao J. Geographical and temporal weighted regression (GTWR)[J]. Geographical Analysis, 2015, 47(4): 431-452. DOI:10.1111/gean.2015.47.issue-4 |
[20] | Huang B, Wu B, Barry M. Geographically and temporally weighted regression for modeling spatio-temporal variation in house prices[J]. International Journal of Geographical Information Science, 2010, 24(3): 383-401. DOI:10.1080/13658810802672469 |
[21] |
王嫣然, 张学霞, 赵静瑶, 等. 2013-2014年北京地区PM2.5时空分布规律及其与植被覆盖度关系的研究[J]. 生态环境学报, 2016, 25(1): 103-111. Wang Y R, Zhang X X, Zhao J Y, et al. Temporal and spatial distribution of PM2.5 and its relationship with vegetation coverage in Beijing during the period of 2013-2014[J]. Ecology and Environmental Sciences, 2016, 25(1): 103-111. |
[22] |
李璇, 聂滕, 齐珺, 等. 2013年1月北京市PM2.5区域来源解析[J]. 环境科学, 2015, 36(4): 1148-1153. Li X, Nie T, Qi J, et al. Regional source apportionment of PM2.5 in Beijing in January 2013[J]. Environmental Science, 2015, 36(4): 1148-1153. |
[23] |
李云婷, 程念亮, 张大伟, 等. 2013年北京市不同方位PM2.5背景浓度研究[J]. 环境科学, 2015, 36(12): 4331-4339. Li Y T, Cheng N L, Zhang D W, et al. PM2.5background concentration at different directions in Beijing in 2013[J]. Environmental Science, 2015, 36(12): 4331-4339. |
[24] | Fouedjio F, Desassis N, Rivoirard J. A generalized convolution model and estimation for non-stationary random functions[J]. Spatial Statistics, 2016, 16: 35-52. DOI:10.1016/j.spasta.2016.01.002 |