2. 北京大学城市与环境学院, 地表过程分析与模拟教育部重点实验室, 北京 100871
2. Laboratory for Earth Surface Processes, Ministry of Education, College of Urban and Environmental Sciences, Peking University, Beijing 100871, China
传统的PM2.5数据监测方法监测点和监测范围有限,为实现PM2.5浓度空间分布高分辨率全域覆盖,本研究基于Arcgis平台(Arcgis 10.1),结合土地利用数据、 路网数据、 DEM数据和人口数据,利用LUR模型模拟重庆市PM2.5浓度空间分布,得到了良好映射结果. 土地利用回归模型(Land Use Regression)最早是由Briggs等[1]于1997年提出,是基于GIS平台,建立大气污染物监测浓度和土地利用等因素之间关系的统计回归模型,来预测高空间分辨率的大气污染物浓度[2]. LUR模型不仅能在一定程度上从机制方面解释大气污染物浓度时空分布特征,而且对大气污染物浓度时空分布的模拟效果不逊色于其他的统计方法(如克里金插值、 离散模型、 暴露指标法等)[3]. LUR模型已经在模拟欧洲、 北美和日本一些城市的NOx、 PM2.5年平均浓度方面取得了不错成绩[4, 5, 6, 7, 8]. 国内对PM2.5等大气污染物的研究主要集中于理化性质、 来源解析、 健康效应与大气能见度等方面[9, 10, 11, 12],也有少部分探讨植被和土地利用等因素对大气污染物浓度的影响[13, 14, 15, 16]. 本研究是实现PM2.5浓度高空间分辨率全域覆盖模拟的理论与实践的一次尝试,结合了GIS强大的空间分析能力,比传统空间插值方法更具可操作性、 可检验性和理论基础. 1 材料与方法 1.1 数据来源及数据预处理 1.1.1 PM2.5数据及监测点简介
受自然和人为因素影响,重庆是中国空气污染较严重的城市之一. 重庆主城区属平行岭谷地貌,背斜发育成宽度较窄的长条形山脉,海拔600~1 000 m,呈东北-西南向,与构造线一致,向斜多发育成宽阔谷地,谷地内部地貌主要是丘陵、 平坝,海拔300~500 m. 重庆人口总数2 945万(2012年),主城区人口密度大,人口985万. 重庆主城区包括都市核心区的渝中、 大渡口、 江北、 沙坪坝、 九龙坡、 南岸6区和外围都市圈的北碚、 渝北、 巴南3区,面积5 473 km2.
主城区有17个监测点(国控)对空气中PM10、 PM2.5、 臭氧等污染物进行同步监测. 17个监测点的位置示意如图 1. 研究区域为根据17个观测站点确定的50 000 m×60 000 m矩形区域(图 1),该区域包括所有PM2.5观测站点. PM2.5浓度数据为2013年4月1日到2013年8月23日每隔1 h的监测数据,来源于重庆市环保局官方网站http://www.cepb.gov.cn/.
![]() | 图 1 空气质量监测点的分布情况示意
Fig. 1 Distribution of air quality monitoring sites in Chongqing
|
分别从重庆市国土资源和房屋勘测规划院和清华大学地球系统科学研究中心(Finer Resolution Observation and Monitoring -Global Land Cover)获取了2011年重庆市土地利用数据,研究中心数据从Landsat TM和 ETM+遥感数据解译而来,空间分辨率为30 m,规划院数据是矢量数据. 对两份数据进行对比、 矫正和综合,得到研究区30 m分辨率土地利用数据(图 2). 根据土地利用现状分类标准,并综合考虑各种土地利用类型数量,将土地利用分为5种类型:不透水地表(imperious)、 植被(vegetation)、 裸地(bareland)、 农用地(cropland)、 水体(water). 对每个站点分别建立5 000、 2 000、 1 000、 500和300 m缓冲区,提取各种土地利用类型占地面积. 利用Arcgis 10.1中的Reclass、 Focal Statistics、 Zonal Statistics as Table等功能计算各个缓冲区内各种土地利用类型的总面积.
![]() | 图 2 研究区土地利用类型栅格数据
Fig. 2 Land use raster data of the study area
|
利用DEM表征研究区地形地貌条件. 重庆是平行岭谷地貌,高低起伏,同时重庆是个重工业城市,假定污染源的位置与海拔存在关系. 可以假定地形地貌对其PM2.5浓度空间分布的影响具有明显地域特征. 从国际科学数据服务平台地理空间数据云(Geospatial Data Cloud)获取DEM数据[利用ASTER GDEM第一版本(V1)数据加工得来],进一步处理得到2012年的30 m分辨率DEM数据(图 3),同时获取每个站点的高程.
![]() | 图 3 研究区30 m分辨率DEM数据
Fig. 3 Dem data of the study area (30 m resolution)
|
17个监测点分布于重庆市主城区,主城区人口多,密度大,2012年主城区人口985万,假设人口集聚会增加PM2.5浓度,用人口数据来表征民用能源消费,因此把人口变量加入模型. 人口数据为2010年重庆市人口分布数据(图 4),空间分辨率0.5′(0.008 33°),来源于 LandScan数据集(Laboratory O R N. LandScan Home). 对每个站点分别建立7 000、 5 000、 3 000和1 000 m缓冲区,并统计各缓冲区内人口数量.
![]() | 图 4 研究区人口数据
Fig. 4 Population data of the study area
|
交通路网表征了机动车的污染排放. 路网数据是基于2012年Landsat TM数据并结合Google Earth进行矢量化得到,并将道路分为高速公路、 主干路、 一级公路、 二级公路、 三级公路和其他道路等6类(图 5). 对每个站点分别建立5 000、 2 000、 1 000、 500、 300和100 m缓冲区,并统计各缓冲区内各道路类型总长度,从而得到个缓冲区内道路状况自变量. 由于300 m和100 m缓冲区内道路类型缺失较多,故将300 m和100 m范围内所有道路类型分别合并,得到300 m缓冲区内的道路总长度和100 m缓冲区内的道路总长度两个变量.
![]() | 图 5 研究区道路数据
Fig. 5 Road data of the study area
|
本研究利用SPSS 20.0的双变量相关性分析和多元线性逐步回归功能,并结合Arcgis 10.1强大的空间分析能力,构建了PM2.5与土地利用类型、 地势地貌、 交通状况和人口状况等相关因素的多元回归模型,并讨论了变量和PM2.5、 变量和变量之间的相关性. 模型的构建分为了模型变量的生成、 模型函数形式与先验假定、 模型算法设置、 回归映射和模型检验这5个部分. 1.2.1 模型变量说明 将选定好的地理变量在Arcgis 10.1中作为预测变量,共有56个变量,分别由路网、 土地利用、 DEM和人口数量四大类衍生出来. 对于自变量缓冲区的设置,结合各栅格的空间分辨率,参考文献[17, 18, 19]对自变量缓冲区的设定,将各个类型变量设置如表 1,并详述了各自变量及其处理方法.
![]() | 表 1 自变量的分类、 描述以及处理方法 Table 1 Classification,description and processing methods of the independent variables |
本研究采用线性回归方程,形式如下:
所在的土地利用等因素有关,ε为随机变量.
根据初步经验,对各变量影响作出先验假设[20](表 2).
![]() | 表 2 模型变量系数符号假定 Table 2 Symbol assumption of the variables coefficient |
使用PM2.5平均浓度数据和变量数据建立模型,模型算法的过程包括以下7步:①计算各变量与PM2.5的相关性; ②剔除变量与PM2.5的正负相关性与先验假定不一致的变量; ③找出每个子类别中排序最高的变量; ④去除每个子类别中与最高排序变量相关的变量(皮尔森检验r>0.6); ⑤将剩余变量代入Stepwise线性回归; ⑥将不满足t检验(α=0.05)的变量从有效性库中剔除; ⑦重复步骤⑤和⑥,直至再去掉一个变量,对模型R2贡献率小于1%. 1.2.4 回归映射
得到土地利用回归方程后,利用方程对非监测点位置进行污染物浓度模拟. 回归映射类似于地统计学中的插值,但能在一定程度上从机制方面模拟污染物浓度空间分布. 1.2.5 映射检验
利用重庆市16个监测点数据,结合土地利用数据、 路网数据、 DEM数据和人口数据建立土地利用回归模型,利用剩余的1个监测点数据来对回归映射结果进行检验.
2 结果与分析 2.1 PM2.5平均浓度
根据17个监测站点2013年4月1日到2013年8月23日每隔1 h的浓度数据,计算各个站点平均浓度(图 6).
![]() | 图 6 17个站点平均浓度及位置示意
Fig. 6 Average concentrations and location of the 17 sites
|
本研究利用SPSS 20.0软件的双变量相关性分析功能,分别分析了56个变量和PM2.5平均浓度的相关性(表 3). 从相关性分析结果可以看出,与因变量PM2.5相关性程度最高的是500 m范围内农用地面积,其次是300 m范围内的农用地面积,然后依次是2 000 m范围内的一级道路总长度、 5 000 m范围内一级道路总长度、 DEM.
![]() | 表 3 自变量与因变量的相关性 Table 3 Correlation between the independent variables and the dependent variable |
根据模型的设置,剔除相关性正负与模型设置的先验假设不一致的变量. 被剔除的变量包括:5 000 m范围内的水体面积、 2 000 m范围内的水体面积、 1 000 m范围内的水体面积、 500 m范围内的水体面积、 300 m范围的水体面积、 2 000 m范围内干道长度、 2 000 m范围内的三级公路长度、 1 000 m范围内的干道长度、 1 000 m范围内的三级公路长度、 1 000 m范围内的其它道路长度、 500 m范围内的干道长度、 500 m范围内的三级道路长度和500 m范围内的其它道路长度,共13个变量. 将56个变量分为12个子类(如表 4)、 DEM、 100 m范围内所有道路总长度和300 m范围内所有道路总长度. 根据模型设置,将模型变量按与污染物浓度相关性进行排序,找出每个子类别中排序最高的变量(变量max),结果如表 4.
![]() | 表 4 每个子类中与PM2.5相关性最强的变量 1) Table 4 Variable most strongly associated with PM2.5 in each sub class |
根据模型的设置,对各个子类别中所包含的变量和对应最高排序变量(变量max)进行相关性分析,剔除皮尔森系数大于0.6的变量,被剔除的变量共有22个,结果如表 5所示.
![]() | 表 5 模型算法第4步被剔除的变量 1) Table 5 Variables excluded by the models forth step |
将经过相关性分析剩余的21自变量和因变量PM2.5平均浓度,加载到SPSS 20.0中,进行逐步多元线性回归,逐渐向方程中加入变量,剔除不显著的变量. 模型结果如表 6.
![]() | 表 6 土地利用回归模型结果 Table 6 Analysis results of land use regression model |
模型R2逐步增加,且最终R2为0.840,所以模型拟合情况很好,解释能力较强. 根据方差分析表,模型非常显著. 21个变量最终只有3个进入回归方程,分别是500 m范围内的农用地面积、 1 000 m范围内一级公路总长度和DEM,回归方程如公式(2).
将进入回归模型的3个变量的30 m×30 m栅格数据代入方程,进行回归映射,得出研究区域PM2.5浓度空间分布情况如图 7.
![]() | 图 7 研究区PM2.5浓度回归映射结果
Fig. 7 Spatial distribution of PM2.5s simulative concentration in the study area
|
根据回归映射结果,检验点杨家坪模拟浓度是41.7 μg ·m-3,同时根据监测数据计算,平均浓度是40.6 μg ·m-3.
根据公式(3),检验点杨家坪误差率为2.7%,误差可接受. 3 讨论
本文是在前人的研究基础上,先假定土地利用类型、 道路交通状况、 人口数量和地形地貌对PM2.5浓度空间分布有影响[21, 22, 23, 24]. 自然条件下,大气中的PM2.5与土地利用关系密切,故本研究把DEM和土地利用加入了模型. 人活动区域强烈的区域,PM2.5很大程度上也受人为活动的制约,本研究用人口数量和交通路网来表征人类的活动,人口数量表征民用能源消费,交通路网表征机动车的污染排放. 然后基于Arcgis平台,通过对监测点建立多种缓冲区,提取缓冲区内的4种数据; 对变量和PM2.5进行相关性分析,剔除和先验假定不一致的变量; 同时对变量按皮尔森系数进行排序,得出各子类中与PM2.5相关性最强的变量; 再剔除各子类中与变量max皮尔森系数大于0.6的变量. 将剩余的变量代入SPSS 20.0 中,进行逐步回归. 通过逐步回归的方法,剔除不显著的变量,最终得到了拟合程度非常好的回归方程. 运用回归方程,代入已经获取的相应的数据,可以映射出研究区内PM2.5浓度空间分布高分辨率图.
从判定系数R2比较来看,最终模型的R2=0.840,模型的拟合情况非常好,解释能力非常强,变量的显著性检验都在0.05以下,结果优于文献[25, 26]的研究结果. 最终进入模型的自变量有3个,分别是500 m范围内的农用地面积、 1 000 m范围内一级公路总长度和DEM. 相关性分析结果显示(表 3),与因变量PM2.5,相关性最高的是500 m范围内农用地面积(r=0.695),其次是300 m范围内的农用地面积(r=0.662),然后依次是2 000 m范围内的一级道路总长度(r=0.66)、 5 000 m范围内一级道路总长度(r=0.628)、 DEM(r=-0.599). 其中,300 m范围内农用地面积和5 000 m范围内一级道路总长度,相关性分析中被剔除,没有进入回归; 2 000 m范围内的一级道路总长度在回归的过程中被剔除. 根据变量之间的相关性和模型设置,结果并不是与PM2.5相关性高的变量都进入了模型.
LUR模型能在一定程度上从机制方面解释大气污染物浓度的空间分布特征. 研究区的农用地多在主城区的边缘,垃圾处理和污染向这些地带转移; 农作物秸秆燃烧,是一种重要的生物质燃烧形式,是大气颗粒物的重要来源; 农田撂荒造成裸地; 重庆是一个重工业城市,以煤碳能源为主,重工业也多位于城市边缘; 重庆农用地面积在2004 年前有略微地增加之后一直减少,意味着有农用地变成其他用地类型,如果变成建设用地,过渡期将产生大量的粉尘. 这些与农用地相关的因素都有可能造成研究区PM2.5浓度上升. 重庆市是一个山城,由于历史原因和地理条件制约,建成的主干道路面较窄,弯道多、 坡度大,人均道路面积低; 道路交通建设滞后,使得在用车的平均排放因子较高; 重庆主城区的机动车保有量除2008年以外数量每年都在上升,且上升的幅度比较大,年均增长量超过了20%; 道路交通制造出大量粉尘,因而PM2.5浓度空间分布与道路关系较大,这与张灿等[27]和罗娜娜等[28]的研究结果相似. 重庆独特的地貌,高低起伏的地势,以及污染源大部分分布在低海拔地区,导致PM2.5浓度空间分布与高程表现出很强的负紧密相关,并且成为重庆研究区的特色.
对于本研究的直接目的,得出了回归映射图. 并选取杨家坪作为检验点对回归映射结果进行检验. 在17个点的空间分布上,杨家坪位于17个点的中间,位于礼嘉与南坪之间,污染程度上杨家坪属于中度污染,因而被选作检验点. 杨家坪的平均浓度的误差率为2.7%,属于可以接受的范围,因而在一定程度上也说明了回归映射结果的可靠性. 4 结论
(1)应用土地利用回归模型,模拟PM2.5平均浓度,其多元线性逐步回归方程的最后模型R2达到0.840,模型的拟合程度非常好,解释能力非常强.
(2)回归方程中,与PM2.5平均浓度空间分布关系最大的因素是监测点的500 m范围内的农用地面积、 然后依次是DEM和1 000 m范围内一级公路总长度.
(3)研究区PM2.5平均浓度分布,以高值分布于主城区中心,沿道路分布趋势明显,与高程紧密相关,高值分布于谷底,低值分布于山脉,模拟结果与实际情况相符.
(4)综合考虑模型结果和检验点杨家坪的误差率为2.7%,本研究基本实现了对城市尺度区域的PM2.5浓度空间分布高辨率模拟.
[1] | Briggs D J, Collins S, Elliott P, et al. Mapping urban air pollution using GIS: a regression-based approach[J]. International Journal of Geographical Information Science, 1997, 11 (7): 699-718. |
[2] | Akita Y, Baldasano J M, Beelen, R, et al. Large scale air pollution estimation method combining land use regression and chemical transport modeling in a geostatistical framework[J]. Environmental Science & Technology, 2014, 48 (8): 4452-4459. |
[3] | Adam-Poupart A, Brand A, Fournier M, et al. Spatiotemporal modeling of ozone Levels in Quebec (Canada): a comparison of Kriging, land-use regression (LUR), and combined bayesian maximum entropy-LUR approaches[J]. Environmental Health Perspectives, 122 (9): 970-976. |
[4] | Kashima S, Yorifuji T, Tsuda T, et al. Application of land use regression to regulatory air quality data in Japan[J]. Science of the Total Environment, 2009, 407 (8): 3055-3062. |
[5] | Tang R, Blangiardo M, Gulliver J. Using building heights and street configuration to enhance intraurban PM10, NOx, and NO2 land use regression models[J]. Environmental Science & Technology, 2013, 47 (20): 11643-11650. |
[6] | Gulliver J, de Hoogh K, Hansell A, et al. Development and back-extrapolation of NO2 land use regression models for historic exposure assessment in Great Britain[J]. Environmental Science & Technology, 2013, 47 (14): 7804-7811. |
[7] | Mavko M E, Tang B, George L A. A sub-neighborhood scale land use regression model for predicting NO2[J]. Science of the Total Environment, 2008, 398 (1-3): 68-75. |
[8] | Rosenlund M, Forastiere F, Stafoggia M, et al. Comparison of regression models with land-use and emissions data to predict the spatial distribution of traffic-related air pollution in Rome[J]. Journal of Exposure Science and Environmental Epidemiology, 2007, 18 (2): 192-199. |
[9] | Lv W W, Wang Y X, Querol X, et al. Geochemical and statistical analysis of trace metals in atmospheric particulates in Wuhan, central China[J]. Environmental Geology, 2006, 51 (1): 121-132. |
[10] | Duan J C, Tan J H. Atmospheric heavy metals and Arsenic in China: Situation, sources and control policies[J]. Atmospheric Environment, 2013, 74: 93-101. |
[11] | Tan J H, Duan J C, Chen D H, et al. Chemical characteristics of haze during summer and winter in Guangzhou[J]. Atmospheric Research, 2009, 94 (2): 238-245. |
[12] | Zhou Y, Hammitt J, Fu J S, et al. Major Factors Influencing the Health Impacts from Controlling Air Pollutants with Nonlinear Chemistry: An Application to China[J]. Risk Analysis, 2014, 34 (4): 683-697. |
[13] | Lai L W. Relationship between fine particulate matter events with respect to synoptic weather patterns and the implications for circulatory and respiratory disease in Taipei, Taiwan[J]. International Journal of Environmental Health Research, 2014, 24 (6): 528-545. |
[14] | Han L J, Zhou W Q, Li W F, et al. Impact of urbanization level on urban air quality: A case of fine particles (PM2.5) in Chinese cities[J]. Environmental Pollution, 2014, 194: 163-170. |
[15] | Wang J D, Wang S X, Jiang J K, et al. Impact of aerosol-meteorology interactions on fine particle pollution during China's severe haze episode in January 2013[J]. Environmental Research Letters, 2014, 9 (9): 094002, doi: 10.1088/1748-9326/9/9/094002. |
[16] | Yan X, Shi W, Zhao W, et al. Estimation of atmospheric dust deposition on plant leaves based on spectral features[J]. Spectroscopy Letters, 47 (7): 536-542. |
[17] | Henderson S B, Beckerman B, Jerrett M, et al. Application of land use regression to estimate long-term concentrations of traffic-related nitrogen oxides and fine particulate matter[J]. Environmental Science & Technology, 2007, 41 (7): 2422-2428. |
[18] | Ross Z, Jerrett M, Ito K, et al. A land use regression for predicting fine particulate matter concentrations in the New York City region[J]. Atmospheric Environment, 2007, 41 (11): 2255-2269. |
[19] | Wang M, Beelen R, Bellander T, et al. Performance of multi-city land use regression models for nitrogen dioxide and fine particles[J]. Environmental Health Perspectives, 2014, 122 (8): 843-849. |
[20] | Beelen R, Hoek G, Vienneau D, et al. Development of NO2 and NOx land use regression models for estimating air pollution exposure in 36 study areas in Europe-The ESCAPE project[J]. Atmospheric Environment, 2013, 72: 10-13. |
[21] | Pascal M, Falq G, Wagner V, et al. Short-term impacts of particulate matter (PM10, PM10-2.5, PM2.5) on mortality in nine French cities[J]. Atmospheric Environment, 2014, 95: 175-184. |
[22] | Hu J L, Wang Y G, Ying Q, et al. Spatial and temporal variability of PM2.5 and PM10 over the north china plain and the Yangtze river delta, China[J]. Atmospheric Environment, 2014, 95: 598-609. |
[23] | Sun F B, Yin Z, Lun X X, et al. Deposition velocity of PM2.5 in the winter and spring above deciduous and coniferous forests in Beijing, China[J]. Plos One, 2014, 9 (5): e97723. |
[24] | Zhang X Y, Kondragunta S, Schmidt C, et al. Near real time monitoring of biomass burning particulate emissions (PM2.5) across contiguous United States using multiple satellite instruments[J]. Atmospheric Environment, 2008, 42 (29): 6959-6972. |
[25] | Kashima S, Yorifuji T, Tsuda T, et al. Application of land use regression to regulatory air quality data in Japan[J]. Science of the Total Environment, 2008, 407 (8): 3055-3062. |
[26] | Dons E, Van Poppel M, Int Panis L, et al. Land use regression models as a tool for short, medium and long term exposure to traffic related air pollution[J]. Science of the Total Environment, 2014, 476-477: 378-386. |
[27] | 张灿, 周志恩, 翟崇治, 等. 基于重庆本地碳成分谱的PM2.5碳组分来源分析[J]. 环境科学, 2014, 35 (3): 810-819. |
[28] | 罗娜娜, 赵文吉, 晏星, 等. 交通与气象因子对不同粒径大气颗粒物的影响机制研究[J]. 环境科学, 2013, 34 (10): 3741-3748. |