2. 北京大学工学院, 北京 100871
2. College of Engineering, Peking University, Beijing 100871, China
近年来, 中国多次出现大范围的持续空气污染, 对民众的身体健康与正常的生产生活造成了严重的危害, 引发了社会各界的极大关注[1, 2].大气颗粒物是影响中国主要城市空气环境质量的首要污染物[3, 4], 其中, 细颗粒物(PM2.5)是当前中国大部分地区的首要污染物, 并与中国近年来多发的雾霾天气有着十分密切的关系. PM2.5具有粒径小, 比表面积大, 活性强, 易富集有毒、有害物质等特点, 对人体健康有重要危害[3~5].影响PM2.5的组成、来源、浓度水平及时空特征的因素众多, 其中工业生产、机动车使用等社会经济因素[6]是其重要组成部分.因此, 探究PM2.5浓度分布的空间特征和社会经济之间的关联, 为PM2.5污染的风险识别和防控管理提供理论基础是近年来国内外学者研究的热点[7].
目前, 研究者对PM2.5的空间分布特征的研究主要尺度停留在街道级[8~10]、城市级[11~13]或者特定城市群[14, 15], 多集中在单个城区或城市展开, 涉及到地区或者国家层面的区域尺度的研究相对较少.另外, 对PM2.5的影响因素的研究主要集中于组成成分、污染源特征等大气化学领域[16, 17]或者气象、地貌等自然地理领域[18, 19], 从全国各个省份的层面讨论城市的经济社会条件对PM2.5的空间分布结构的影响的研究相对有限.
本文以中国省级行政区划为基本单元, 首先以1497个PM2.5监测站点数据为基础讨论PM2.5浓度在国家尺度上的分布特征; 然后再研究各项社会经济指标对PM2.5浓度分布的影响.
1 材料与方法 1.1 数据来源本研究的PM2.5浓度数据来自中国环境监测总站的全国城市空气质量实时发布平台.本文选取2015年全年的全国PM2.5实时监测数据, 共有1497个站点, 覆盖全国31个省级行政区(香港、澳门、台湾除外).每个站点的采样间隔为1 h, PM2.5浓度的单位为.首先计算得到每个监测站点的年平均值, 然后对其进行克里金插值, 得到全国PM2.5的年均浓度分布情况.插值结果交叉检验的误差标准平均值为0.0234, 接近于0, 标准均方根误差为0.748, 平均标准误差10.7787接近于误差均方根8.1024.以上结果表明采用克里格插值法对全国PM2.5进行空间插值的精度较高, 效果较好.
社会经济类数据来源于文献[20].本研究选取了12类社会经济影响因素:人口数、城市人口密度、地区生产总值、第一产业占比、第二产业占比、人均私家车保有量、烟粉尘排放量、公共交通车辆运营数、绿化覆盖率、人均电力消费量、建成区面积、森林覆盖率.
1.2 研究方法 1.2.1 空间自相关分析空间自相关分析主要研究地理空间上的各项观测值之间的相关程度[21, 22].空间自相关的基本度量是空间的自相关系数, 莫兰指数(Moran's I指数)是最常见的一种, 又可分为全局Moran's I指数[23]和局部Moran's I指数[24].全局空间自相关可以用来描述整个研究区域上所有空间对象之间的平均关联程度、空间分布模式及显著性.局域空间自相关可以用来描述不同空间位置上可能存在的空间关联模式, 从而发现数据之间的空间异质性.
1.2.2 多重共线性分析因为社会经济类因素之间可能存在多重共线性问题, 本文引入方差膨胀因子(variance inflation factor, VIF)来检查各因素之间的多重共线性.方差膨胀因子由Marquardt于1970年提出[25], 是衡量多元线性回归模型中多重共线性严重程度的一个指标.它表示回归系数估计量的方差与假设自变量间不线性相关时方差相比的比值.方差膨胀因子(VIF)越大, 表明共线性越严重.经验判断方法表明:当0<VIF<10时, 不存在多重共线性; 当10≤VIF<100时, 存在较强的多重共线性.
1.2.3 地理加权回归分析传统的统计模型是基于数据独立、均匀分布假设的前提下建立的.全局空间回归模型就是假定回归参数与样本数据的地理位置无关, 其回归模型与最小二乘回归模型(ordinary least squares, OLS)相同.而在PM2.5浓度分布的问题中, 不同影响因素在不同地理位置上往往表现的也不同, 也就是说回归参数随地理位置变化, 这时如果仍然采用全局空间回归模型, 得到的回归参数估计将是回归参数在整个研究区域内的平均值, 不能反映回归参数的真实空间特征.为解决上述问题, Fotheringham提出了地理加权回归模型(geographical weighted regression, GWR)[26], 该模型是用于研究空间关系的一种回归模型, 可以有效地揭示被观测者空间非平稳性和空间依赖.
本文采用地理加权回归分析工具GWR4对PM2.5浓度分布和各社会经济影响因素进行地理回归加权分析.考虑到各指标可能与PM2.5存在非线性关系, 将每个指标的平方[7], 参与到模型的建立过程中, 并对各个因素都进行了归一化处理.空间权重矩阵是地理加权回归模型(GWR)的核心, 空间权函数的选取对地理加权回归模型(GWR)的参数估计影响很大.本文采取通常使用的bi-square函数来计算权重, bi-square函数形式如公式(1)所示:
![]() |
(1) |
式中, dij表示数据点j与位置点之间的距离, 本文选择以各省的中心点的地理距离表示dij; wij是对位置i点刻画模型时数据点j的权重; b是带宽, 有两层含义:首先b作为一个临界值, 在数据点带宽范围之外的点不参加该点的权值计算; 其次在带宽b的范围内, 指的就是权重与距离之间函数关系的非负衰减参数, 带宽越大, 权重随距离的增加衰减的越慢, 带宽越小, 权重随距离的增加衰减的就快.为了取得最优带宽, Fotheringham提出一个标准, 当GWR模型的赤池信息准则(AIC)[27]是最小时, 带宽b为最佳.
2 结果与分析 2.1 空间自相关结果分析中国各省级行政区的PM2.5年均浓度的分布如图 1所示, 基本呈现为以京津冀、山东、河南为中心高浓度地区, 向四周逐渐递减的空间分布结构, 表现出一定的聚集性.
![]() |
图 1 PM2.5年均浓度分布 Fig. 1 Distribution of PM2.5 concentration |
全局Moran's I指数指示PM2.5浓度在整个中国地区的空间关联程度. PM2.5年均浓度数据的全局Moran散点图如图 2所示, 其Moran's I指数为0.578, P值为0.0010, 这说明中国地域的PM2.5浓度分布从省级行政区划的尺度上看, 存在明显的空间自相关性.另一方面, 图 2中散点集中分布在第一象限(“高-高”)和第三象限(“低-低”), 表明高值区域被高值邻居所包围的地域和低值区域被低值邻居所包围的地域普遍存在, 即表示区域与其周边地区的差异较小, 较高值或较低值的地区集中分布.结合中国各省级行政区浓度分布(图 1), 可以得出中国PM2.5年均浓度的分布基本呈现为以京津冀、山东、河南为中心高浓度地区, 向四周逐渐递减的空间分布结构, 表现出一定的聚集性.
![]() |
图 2 PM2.5年均浓度全局Moran散点图 Fig. 2 Univariate Moran's I for PM2.5 concentration |
对中国地区PM2.5浓度的局部空间自相关情况进行检验, 生成局部自相关指标(local indicators of spatial association, LISA)聚集图(图 3)和局部自相关指标显著性图(图 4).从图 3和图 4中可以看出在京津冀、河南、安徽、山东一带呈现明显的PM2.5浓度高值聚集(“高-高”), 而广西、四川、西藏、云南一带呈现明显的低值聚集(“低-低”), 其它省级行政区局部聚集情况并不显著.
![]() |
图 3 PM2.5年均浓度LISA聚集 Fig. 3 LISA cluster map for PM2.5 concentration |
![]() |
图 4 PM2.5年均浓度LISA显著性 Fig. 4 LISA significance map for PM2.5 concentration |
为了解决多个因素之间的共线性问题, 引入方差膨胀因子(VIF), 计算各个因素之间的VIF值, 结果如表 1所示.
![]() |
表 1 各影响因素之间VIF值 Table 1 VIF values of drivers |
根据表 1中的结果, 人口数、地区生产总值、公共交通车辆运营数和建成区面积四项因素的VIF值大于10, 表明每个因素自身与其它因素呈现较强的多重共线性, 在之后的回归分析中舍弃.而城市人口密度、第一产业占比、第二产业占比、人均私家车保有量、烟粉尘排放量、绿化覆盖率、人均电力消费量、森林覆盖率这八项因素不存在或仅存在较弱的多重共线性, 可以用于之后的回归分析当中.
2.3 地理加权回归结果分析本研究得到OLS模型和GWR模型的对比结果如表 2所示.
![]() |
表 2 OLS与GWR比较 Table 2 Comparison between OLS and GWR models |
首先, 根据OLS回归结果, 模型整体上是显著的, 根据OLS的Radj2的值表明, 该模型能解释PM2.5浓度分布的49.2%. OLS模型的残差图(图 5)中的Moran's I指数为-0.171, 可以看出, OLS模型存在较高的空间自相关性.由于较强的空间自相关的存在, 全局模型建立在OLS模型上是不合适的.
![]() |
图 5 OLS模型各省残差分布 Fig. 5 Residual map for OLS |
其次, 对比OLS模型, GWR模型在统计结果上非常显著, 能解释PM2.5浓度分布的53.6%, 高于OLS模型.并且GWR模型的残差平方和(RSS)以及赤池信息准则(AIC)也低于OLS模型.此外, GWR模型的残差分布如图 6所示, 虽然空间自相关性仍然存在, 但是计算Moran's I指数为-0.159, 优于OLS模型.总的来说, GWR模型在各项指标上均优于OLS模型.在回归对象存在较强的空间自相关性的时候, GWR模型可以比OLS模型更好地揭示出PM2.5浓度分布和各项指标之间复杂的关系和空间依赖性.
![]() |
图 6 GWR模型各省残差分布 Fig. 6 Residual map for GWR |
表 3列出了OLS和GWR估计的回归系数. 8个因素中, 在显著性水平的情况下, 只有森林覆盖率和人均私家车保有量达到显著性水平; 在显著性水平的情况下, 人均电力消费量也达到了显著性水平.其中, 人均电力消费量和森林覆盖率与PM2.5浓度呈负相关关系, 人均私家车保有量呈正相关关系.
![]() |
表 3 回归模型参数1) Table 3 Parameters in the regression models |
GWR的估计系数分布的箱线图如图 7所示.从中可以看出, 第二产业占比、人均私家车保有量、绿化覆盖率和森林覆盖率对PM2.5浓度分布的影响保持在较高水平, 反之, 烟尘排放量的影响并不显著.此外, 第二产业占比、绿化覆盖率对PM2.5浓度分布的影响随着区位变化而变化的较为显著, 反之, 烟尘排放量的影响则不随区位变化而显著变化.
![]() |
横坐标的1~8分别代表城市人口密度、第一产业占比、第二产业占比、人均私家车保有量、烟粉尘排放量、绿化覆盖率、人均电力消费量、森林覆盖率这8项因素 图 7 GWR模型各因素系数分布箱线图 Fig. 7 Box map of factor coefficient distribution in the GWR model |
综合表 3和箱线图(图 7)的各项指标显著性水平和回归系数, 人均私家车保有量是各项指标中影响PM2.5浓度的最重要的因素.由GWR模型回归系数平均值可以看出, 人均私家车保有量的平方每提高1, PM2.5浓度提高0.261.由PM2.5浓度分布[图 8(a)]、人均私家车保有量分布[图 8(b)]对比可以看出, 人均私家车保有量的两个峰值分别是北京和浙江两地, 然后向中部逐渐降低, 在南部、中部大部分地区和西北部地区都处于较低水平和PM2.5分布情况大致符合.图 8(b)中, GWR模型的人均私家车保有量回归系数分布表现为从西向东逐渐减小, 两端极大值分别出现在新疆和东南沿海地区.结合图 8(b)中的人均私家车保有量分布及其GWR模型回归系数分布, 可以很好的解释新疆地区虽然人均私家车保有量处于较低水平, 但由于其影响程度更大, 所以PM2.5浓度处于中等水平; 而浙江省的人均私家车保有量很高, 但由于其影响程度较低, 所以PM2.5浓度分布处于中部水平, 高于东南部其它沿海省份, 但低于其它人均私家车保有量高的中部省份. GWR模型的回归参数呈现这种分布规律可能是由于地形和气候的影响:西部地区主要为内陆地区, 东南部地区主要为沿海地区, 沿海地区具有更好的气象条件来降低汽车尾气对PM2.5的影响.
![]() |
图 8 全国PM2.5浓度及显著性指标分布情况 Fig. 8 Distribution of PM2.5 concentration and significant index in China |
森林覆盖率也对PM2.5浓度有显著的影响.由GWR模型回归系数平均值可以看出, 森林覆盖率的平方每提高1, PM2.5浓度降低0.268.从箱线图和图 8(c)中GWR模型的森林覆盖率回归系数分布看, 森林覆盖率对PM2.5的影响一直保持在较高的水平, 整体上趋势表现为由西向东森林覆盖率对PM2.5浓度分布的影响逐渐增加.对比PM2.5浓度分布[图 8(a)]和森林覆盖率分布[图 8(c)]可以看出, 中国森林覆盖率高的地区主要集中在南部沿海地区和东南地区, 这和PM2.5浓度在南部地区以及东南部地区较低的情况一致; 其余大部分地区森林覆盖率都处在较低水平, 对降低PM2.5浓度不能起到显著的影响.
人均电力消费量对PM2.5浓度也存在一定的影响, 且和PM2.5浓度呈负相关.由GWR模型回归系数平均值可以看出, 人均电力消费量的平方每提高1, PM2.5浓度降低0.153.从图 8(d)可以看出, 人均电力消费水平较高的地区主要分布在中国西北部和东部沿海地区, 中部地区人均电力消费水平较低, 与PM2.5高浓度地区主要集中在中部地区的情况[图 8(a)]相符.影响各省人均电力消费量的因素众多, 人均电力消费量对PM2.5浓度的影响可能是多种因素的综合体现(GDP因素、发电方式、电力行业排放等), 但从省级尺度来说, 人均电力消费量的增加有助于降低PM2.5浓度.
4 结论(1) 空间自相关分析表明PM2.5浓度在全国尺度的空间分布呈显著的正相关性, 存在以京津冀、山东、河南为中心高浓度地区, 向四周逐渐递减的空间分布结构, 且在广西、四川、西藏、云南一带呈现明显的低值聚集.
(2) 比较OLS模型和GWR模型在PM2.5回归分析中的优劣.结论表明, GWR模型在处理本文中讨论的具有较强空间自相关性的空间变量时, 有着更好的拟合程度.
(3) GWR模型结果表面, 在显著性水平的情况下, 森林覆盖率、人均私家车保有量和人均电力消费量这3个因素达到显著性水平.其中, 人均电力消费量和森林覆盖率与PM2.5浓度呈负相关关系, 其余均呈现正相关关系.在本文涉及的所有因素中, 人均私家车保有量和森林覆盖率对PM2.5浓度的影响最明显, 人均电力消费量也对抑制PM2.5浓度有显著影响.
[1] | Li M N, Zhang L L. Haze in China:current and future challenges[J]. Environmental Pollution, 2014, 189: 85-86. DOI:10.1016/j.envpol.2014.02.024 |
[2] | Tang D L, Li T Y, Chow J C, et al. Air pollution effects on fetal and child development:a cohort comparison in China[J]. Environmental Pollution, 2014, 185: 90-96. DOI:10.1016/j.envpol.2013.10.019 |
[3] | Xie P, Liu X Y, Liu Z R, et al. Human health impact of exposure to airborne particulate matter in Pearl River Delta, China[J]. Water, Air, & Soil Pollution, 2011, 215(1-4): 349-363. |
[4] | Wu S W, Deng F R, Wei H Y, et al. Association of cardiopulmonary health effects with source-appointed ambient fine particulate in Beijing, China:a combined analysis from the healthy volunteer natural relocation (HVNR) study[J]. Environmental Science & Technology, 2014, 48(6): 3438-3448. |
[5] | Sofowote U M, Su Y S, Dabek-Zlotorzynska E, et al. Constraining the factor analytical solutions obtained from multiple-year receptor modeling of ambient PM2.5 data from five speciation sites in Ontario, Canada[J]. Atmospheric Environment, 2015, 108: 151-157. DOI:10.1016/j.atmosenv.2015.02.045 |
[6] | Lin G, Fu J Y, Jiang D, et al. Spatio-Temporal variation of PM2.5 concentrations and their relationship with geographic and socioeconomic factors in China[J]. International Journal of Environmental Research and Public Health, 2014, 11(1): 173-186. |
[7] |
杨昆, 杨玉莲, 朱彦辉, 等. 中国PM2.5污染与社会经济的空间关系及成因[J]. 地理研究, 2016, 35(6): 1051-1060. Yang K, Yang Y L, Zhu Y H, et al. Social and economic drivers of PM2.5 and their spatial relationship in China[J]. Geographical Research, 2016, 35(6): 1051-1060. |
[8] |
李龙凤, 王新明, 赵利容, 等. 广州市街道环境PM10和PM2.5质量浓度的变化特征[J]. 地球与环境, 2005, 33(2): 57-60. Li L F, Wang X M, Zhao L R, et al. Variations of PM10 and PM2.5 levels in street microenvironment in Guangzhou[J]. Earth and Environment, 2005, 33(2): 57-60. |
[9] | Kim K Y, Kim Y S, Roh Y M, et al. Spatial distribution of particulate matter (PM10 and PM2.5) in Seoul Metropolitan Subway stations[J]. Journal of Hazardous Materials, 2008, 154(1-3): 440-443. DOI:10.1016/j.jhazmat.2007.10.042 |
[10] |
欧阳, 赵文吉, 郑晓霞, 等. 机动车排放对PM2.5空间分布的影响研究[J]. 生态环境学报, 2015, 24(12): 2009-2016. Ou Y, Zhao W J, Zheng X X, et al. Effect of vehicles on the temporal and spatial distribution of PM2.5[J]. Ecology and Environment Sciences, 2015, 24(12): 2009-2016. |
[11] |
吴健生, 廖星, 彭建, 等. 重庆市PM2.5浓度空间分异模拟及影响因子[J]. 环境科学, 2015, 36(3): 759-767. Wu J S, Liao X, Peng J, et al. Simulation and influencing factors of spatial distribution of PM2.5 concentrations in Chongqing[J]. Environmental Science, 2015, 36(3): 759-767. |
[12] |
焦利民, 许刚, 赵素丽, 等. 基于LUR的武汉市PM2.5浓度空间分布模拟[J]. 武汉大学学报(信息科学版), 2015, 40(8): 1088-1094. Jiao L M, Xu G, Zhao S L, et al. LUR-based simulation of the spatial distribution of PM2.5 of Wuhan[J]. Geomatics and Information Science of Wuhan University, 2015, 40(8): 1088-1094. |
[13] | Xu G, Jiao L M, Zhang B E, et al. Spatial and temporal variability of the PM2.5/PM10 Ratio in Wuhan, Central China[J]. Aerosol and Air Quality Research, 2017, 17(3): 741-751. DOI:10.4209/aaqr.2016.09.0406 |
[14] |
许刚, 焦利民, 肖丰涛, 等. 土地利用回归模型模拟京津冀PM2.5浓度空间分布[J]. 干旱区资源与环境, 2016, 30(10): 116-120. Xu G, Jiao L M, Xiao F T, et al. Applying land use regression model to estimate spatial distribution of PM2.5 concentration in Beijing-Tianjin-Hebei region[J]. Journal of Arid Land Resources and Environment, 2016, 30(10): 116-120. |
[15] |
周磊, 武建军, 贾瑞静, 等. 京津冀PM2.5时空分布特征及其污染风险因素[J]. 环境科学研究, 2016, 29(4): 483-493. Zhou L, Wu J J, Jia R J, et al. Investigation of temporal-spatial characteristics and underlying risk factors of PM2.5 pollution in Beijing-Tianjin-Hebei Area[J]. Research of Environmental Sciences, 2016, 29(4): 483-493. |
[16] |
洪纲, 周静博, 姜建彪, 等. 空气细颗粒物(PM2.5)的污染特征及其来源解析研究进展[J]. 河北工业科技, 2015, 32(1): 64-71. Hong G, Zhou J B, Jiang J B, et al. Research progress of characteristics and source apportionment of air fine particle pollution (PM2.5)[J]. Heibei Journal of Industrial Science and Technology, 2015, 32(1): 64-71. |
[17] | Chen Y, Schleicher N, Cen K, et al. Evaluation of impact factors on PM2.5 based on long-term chemical components analyses in the megacity Beijing, China[J]. Chemosphere, 2016, 155: 234-242. DOI:10.1016/j.chemosphere.2016.04.052 |
[18] | Tunno B J, Dalton R, Michanowicz D R, et al. Spatial patterning in PM2.5 constituents under an inversion-focused sampling design across an urban area of complex terrain[J]. Journal of Exposure Science & Environmental Epidemiology, 2016, 26(4): 385-396. |
[19] | Liang X, Zou T, Guo B, et al. Assessing Beijing's PM2.5 pollution:severity, weather impact, APEC and winter heating[J]. Proceedings of the Royal Society A:Mathematical Physical and Engineering Sciences, 2015, 471(2182): 20150257. DOI:10.1098/rspa.2015.0257 |
[20] | 中华人民共和国国家统计局. 中国统计年鉴-2016[EB/OL]. http://www.stats.gov.cn/tjsj/ndsj/2016/indexch.htm, 2016-10-18. |
[21] | Griffith D A. Provincial-level spatial statistical modelling of the change in per capita disposable Family Income in Spain, 1975-1983[J]. Cybergeo:European Journal of Geography, 1998. DOI:10.4000/cybergeo.385 |
[22] |
翟卫欣, 程承旗. 一种空间权重矩阵的优化方法[J]. 武汉大学学报(信息科学版), 2017, 42(6): 731-736. Zhai W X, Cheng C Q. An improved spatial weights matrix construction strategy[J]. Geomatics and Information Science of Wuhan University, 2017, 42(6): 731-736. |
[23] | Moran P A P. The interpretation of statistical maps[J]. Journal of the Royal Statistical Society, 1948, 10(2): 243-251. |
[24] | Anselin L. Local indicators of spatial association-LISA[J]. Geographical Analysis, 1995, 27(2): 93-115. |
[25] | Marquardt D W. Generalized inverses, ridge regression, biased linear estimation, and nonlinear estimation[J]. Technometrics, 1970, 12(3): 591-612. |
[26] | Brunsdon C, Fotheringham A S, Charlton M E. Geographically weighted regression:a Method for Exploring Spatial Nonstationarity[J]. Geographical Analysis, 1996, 28(4): 281-298. |
[27] | Akaike H. Factor analysis and AIC[J]. Psychometrika, 1987, 52(3): 317-332. DOI:10.1007/BF02294359 |