环境科学  2020, Vol. 41 Issue (5): 2057-2065   PDF    
基于随机森林模型的中国PM2.5浓度影响因素分析
夏晓圣1,2, 陈菁菁1,2, 王佳佳1,2, 程先富1,2     
1. 安徽师范大学地理与旅游学院, 芜湖 241002;
2. 安徽自然灾害过程与防控研究省级实验室, 芜湖 241002
摘要: 选取气溶胶光学厚度、海拔、年降水量、年均气温、年均风速、人口密度、GDP密度和NDVI作为影响因子,基于随机森林模型、特征重要性排序和偏依赖图技术,研究中国PM2.5浓度空间分布的影响因素及其区域差异.结果表明:①与多元回归、广义可加模型和BP神经网络相比,随机森林模型估算的PM2.5浓度精度最高,可用于PM2.5污染的影响因素研究.② PM2.5浓度随气溶胶光学厚度、人口密度和GDP密度的增加呈先上升后平稳的趋势,随降水、风速和NDVI的增加呈先下降后平稳的趋势,随海拔和气温的增加呈下降→上升→下降的趋势.③气溶胶光学厚度对PM2.5浓度空间分布的影响最大,可解释37.96%的PM2.5浓度空间分异;年降水量对PM2.5浓度空间分布的影响最小,解释率仅为5.75%.④影响因子与PM2.5浓度的关系存在空间异质性,同一影响因子对不同地理分区的PM2.5浓度的影响程度有所不同.气溶胶光学厚度对华南地区PM2.5浓度的空间分布影响最大,对东北地区影响最小.
关键词: PM2.5      影响因素      区域差异      随机森林      中国     
PM2.5 Concentration Influencing Factors in China Based on the Random Forest Model
XIA Xiao-sheng1,2 , CHEN Jing-jing1,2 , WANG Jia-jia1,2 , CHENG Xian-fu1,2     
1. College of Geography and Tourism, Anhui Normal University, Wuhu 241002, China;
2. Provincial Key Laboratory of Natural Disaster Process and Prevention, Anhui Province, Wuhu 241002, China
Abstract: In this paper, aerosol optical depth (AOD), elevation (DEM), annual precipitation (PRE), annual average temperature (TEM), annual average wind speed (WS), population density (POP), gross domestic product density (GDP), and normalized difference vegetation index (NDVI) were selected as factors influencing PM2.5 concentration. The random forest model, order of feature importance, and partial dependency plots were applied to investigate these factors and their regional differences in PM2.5 spatial pattern. The results showed that:① The random forest model was more accurate than multiple regression, generalized additive, and back propagation neural network models in estimating PM2.5 concentration, which can be applied to quantifying PM2.5 influencing factors. ② PM2.5 concentration initially increased and then remained stable with increases in AOD, POP, and GDP, and initially decreased and then stabilized with increases in PRE, WS, and NDVI. The responses of DEM and TEM to PM2.5 concentration changed from decline to ascend and then changed to decline again. ③ AOD had the largest influence on PM2.5 annual concentrations with a spatial influencing magnitude of 37.96%, whereas PRE had the least influence with a merely individual spatial influencing magnitude of 5.75%. ④ The relationships between PM2.5 pollution and influencing variables vary with geography and thus exhibit significant spatial heterogeneity. The same factor had different spatial influencing magnitudes on PM2.5 annual concentrations in seven geographical subareas. AOD had the greatest influence on PM2.5 concentration in the south of China, with the least influence in the northeast.
Key words: PM2.5      influencing factor      regional variation      random forest      China     

PM2.5是中国目前面临的最重要的大气污染物, 呈现出典型的区域性、复合型污染特征, 逐渐演变为中国大气污染的重点和难点[1].高浓度的PM2.5不仅降低大气能见度[2]和影响局地气候[3], 还危害人体健康[4]和增加居民死亡率[5].因此, 识别PM2.5浓度的关键影响因素对防治大气污染至关重要.

目前, 学者们主要从自然和社会经济因素两个方面, 应用多元回归[6]、空间计量模型[7]、因素分解模型[8]、地理探测器[9]、地理加权回归模型[10, 11]和化学传输模型[12]等方法进行PM2.5浓度的影响因素研究.例如, Meng等[6]利用多元回归分析了逆温、大气边界层高度、风向和相对湿度等不同气象因子对北京市冬季PM2.5浓度的相对贡献.Jiang等[13]基于结构方程模型量化城市规模、工业活动和居民活动等不同社会经济因子对中国城市PM2.5污染的相对贡献.刘海猛等[7]运用空间自相关分析和空间计量模型, 定量解析了自然与人文因素对京津冀区县尺度PM2.5的贡献程度及其空间溢出效应.近年来, 机器学习在PM2.5污染研究领域的应用不断深化, 主要集中在PM2.5浓度估算和预测[14~16]以及大气污染定量归因的跨学科研究[17~21].如尹晓梅等[17]借助大数据挖掘算法, 基于K近邻和支持向量机模型评估气象和减排对北京市空气质量改善的贡献.Li等[20]利用卷积神经网络模型探讨人口密度、GDP密度、地形、土地利用对PM2.5浓度空间分布的影响.贺祥等[19]运用广义可加模型分析影响因素的交互作用对PM2.5浓度变化的影响.

应用机器学习技术研究PM2.5浓度的影响因素, 取得了丰富的成果, 但前人的研究大多关注于机器学习模型的拟合精度, 缺乏对模型本身的解释[20];且对地理空间维度重视不够, 缺乏对PM2.5浓度影响因素的空间异质性研究.随机森林模型一般不考虑回归分析中的多元共线性问题, 无需进行变量选择, 可借助特征重要性排序和偏依赖图等方法提高模型的可解释性.如王超等[22]基于随机森林模型和特征重要性排序探索西藏地区人口分布的影响因素及其区域差异.Ye等[23]应用随机森林模型和偏依赖图技术明确地形、道路等要素对中国人口空间分布的影响.因此, 本研究首先基于随机森林模型, 应用特征重要性排序和偏依赖图技术增强模型的可解释性, 明确影响因子对PM2.5浓度的相对重要性和非线性响应关系.其次, 利用模型验证集的拟合精度(R2)量化和比较影响因素对PM2.5浓度空间分异的解释力度.最后从区域分异的视角, 比较同一影响因素对不同地理分区PM2.5浓度的影响差异.

1 材料与方法 1.1 研究区概况

PM2.5浓度与其影响因素间的关系具有明显的空间异质性.因此, 本文基于中国科学院自然地理分区标准, 将中国划分为七大地理分区(图 1), 从全国和区域两个尺度分析各影响因素与PM2.5浓度的关系, 着重讨论同一影响因素与PM2.5浓度的关系在不同区域间的差异.

图 1 中国七大地理分区分布示意 Fig. 1 Map of China and the its seven geographical subareas

1.2 研究数据

根据对已有研究的梳理, 基于数据能够被栅格化的原则, 本文选取2000、2005、2010和2015年这4个时期年降水量(PRE)、年均气温(TEM)、年均风速(WS)、海拔高度(DEM)和NDVI作为自然因子解释变量, AOD、人口密度(POP)和GDP密度(GDP)作为社会经济解释变量.由于产业结构、能源消费等统计年鉴数据缺乏成熟的空间化栅格数据集, 故本研究未选用此类指标变量.

1.2.1 PM2.5数据

2000~2015年PM2.5年均浓度栅格数据集来源于戴尔豪斯大学大气成分分析组织, 网址为http://fizz.phys.dal.ca/~atmos/martin/?page_id=140, 空间分辨率为0.1°×0.1°[24].

1.2.2 再分析数据集

MERRA-2再分析数据集是NASA戈达德地球科学数据和信息服务中心在融合多种气象观测资料和卫星数据基础上所生成的同化数据集, 空间分辨率为0.5°×0.625°(纬度×经度).本文提取逐月气溶胶光学厚度(AOD)和风速(由10 m径向风和纬向风合成)数据, 利用均值合成年均AOD和年均风速.

1.2.3 栅格数据集

年降水量和年均气温数据来自于中国科学院资源环境科学数据中心的中国1980年以来逐年年降水量、年平均气温空间插值数据集.该数据集是基于全国2 400多个气象站点日观测数据, 通过整理、计算和空间插值处理生成, 空间分辨率为1 km×1 km.

NDVI、DEM、GDP密度和人口密度数据均来自于中国科学院资源环境科学数据中心(http://www.resdc.cn/), 空间分辨率为1 km×1 km.

1.2.4 数据处理

首先, 将所有栅格数据统一投影至China-Lambort投影, 并重采样至10 km分辨率.其次, 将PM2.5年均浓度栅格数据转点, 利用ArcGIS中Extract Multi Values to Points工具提取解释变量栅格相应位置处的像元值, 实现PM2.5年均浓度和所有解释变量数据的空间匹配, 共计360 808个匹配样本.以2015年为例, 所有影响因素的可视化展示如图 2所示.

图 2 2015年解释变量的空间分布 Fig. 2 Spatial pattern diagram of independent variables in 2015

1.3 随机森林模型

随机森林(RF)模型是Breiman提出的一种基于决策树的机器学习算法[25].RF通过bootstrap重采样技术从原始训练样本集中抽取并生成训练样本子集, 然后根据训练样本集生成多个决策树并组成随机森林, 其分类或回归模型结果按决策树投票分数而定.

本文基于360 808个匹配样本数据, 将所有影响因素作为解释变量, PM2.5年均浓度作为因变量, 构建随机森林回归模型(图 3).按1:9的比例划分训练集和测试集, 利用测试集的模型精度(R2)衡量影响因素对PM2.5浓度空间分布的影响大小.

图 3 随机森林模型示意 Fig. 3 Diagram of random forest model

偏依赖图(partial dependency plot)显示了机器学习模型中一个自变量对先前拟合模型预测结果的边际效应, 被视为一种对机器学习结果的可解释的方法[26].偏依赖函数xs可通过固定某个变量, 计算其它变量的所有组合的预测函数的平均值得到.

(1)

式中, 为机器学习模型(本文中为随机森林模型), xs为偏依赖图需要绘制的变量, xc为机器学习模型中使用的其它变量.

1.4 广义可加模型

广义可加模型(GAM)是Hastie等[27]提出的一种融合可加模型和广义线性模型的非参数回归模型, 可对部分解释变量进行线性拟合, 对其他因子进行平滑函数拟合.模型无需预先设定参数模型, 通过建立解释变量的平滑函数, 能够自动选择合适的多项式.

(2)

式中, μ=E(Y|X1, X2, …, Xp), g(μ)是连接函数, Xi为解释变量, sp(Xp)是非参数平滑函数, 其估计方法有平滑样条法、局部加权回归散点平滑法、薄板平滑样条法.

1.5 BP神经网络

BP神经网络是一种多层前馈神经网络, 包含正向传播和反向传播两个过程[14].通过模仿人脑神经元的运行机制, 神经网络具有自学习、自适应的优点, 较强的非线性映射和泛化能力.

2 结果与讨论 2.1 随机森林模型的适用性评估

相关性分析表明, PM2.5年均浓度与所有影响因子的相关系数均显著, 但与人口密度的偏相关系数不显著(表 1).这是因为2006年以来, 中国PM2.5污染整体呈好转趋势[9], 而人口呈缓慢增加趋势, 说明人口并非是影响PM2.5浓度的关键因素.回归分析显示, PM2.5年均浓度与AOD、TEM和GDP呈正相关, 与PRE、WS、DEM和NDVI呈负相关;AOD、PRE、WS和NDVI对PM2.5年均浓度的影响较大, TEM、DEM和GDP的影响较小.

表 1 PM2.5年均浓度与影响因子的相关系数与标准化回归系数1) Table 1 Correlation coefficient and standard regression coefficient between PM2.5 annual average concentration and each influencing factor

将影响因素作为自变量, PM2.5年均浓度作为因变量, 分别构建多元线性回归、广义可加模型、BP神经网络和随机森林回归模型, 并比较4种方法在测试集中的精度(R2和RMSE).由图 4可知, 随机森林回归的拟合精度(R2)最高, 优于BP神经网络、广义可加模型和多元线性回归;多元线性回归的预测误差(RMSE)最大, 大于广义可加模型、BP神经网络和随机森林回归;此外, 多元线性回归、广义可加模型和BP神经网络的PM2.5年均浓度估计值中存在负值, 与实际意义相悖, 而随机森林拟合值中未发现负值.因此, 可以用随机森林方法分析PM2.5浓度空间分异的影响因素.随机森林模型预测的2015年PM2.5年均浓度的空间化可视效果如图 5所示, 可以发现:除少数像元外, 随机森林预测的PM2.5年均浓度均能很好地刻画原始PM2.5浓度的空间格局、污染中心.

图 4 4种模型估算的PM2.5年均浓度验证 Fig. 4 Scatter plots of PM2.5 annual concentration for model estimation and original data

图 5 2015年PM2.5年均浓度原始值与随机森林模型估计值的空间分布 Fig. 5 Original, estimated spatial distribution of PM2.5 annual concentrations by random forest model over China in 2015

2.2 影响因素对PM2.5浓度的响应

本文分别利用特征重要性排序和偏依赖关系图来增强随机森林模型的可解释性, 图 6为IncMSE方法和IncNodePurity方法得到的变量重要性排序.两种不同重要性排序方法的结果大同小异:AOD、DEM、PRE和TEM的变量重要性强于NDVI、WS、POP和GDP;IncMSE方法中, DEM的重要性最强, POP最弱;IncNodePurity方法中, AOD的重要性最强, GDP最弱.与标准化回归系数相比, 基于随机森林算法的影响因子重要性排序情况也有所差异.

图 6 影响因子重要性排序 Fig. 6 Importance ranking of influencing factors

偏依赖图显示PM2.5浓度和影响要素之间的相关性.随着AOD的增加, PM2.5浓度随之增加[图 7(a)].当AOD大于0.7时, 对PM2.5浓度分布的影响程度达到最大并保持不变.海拔[图 7(b)]与PM2.5浓度分布的关系呈下降→上升→下降的趋势:当海拔低于600 m时, 随着海拔的升高, PM2.5浓度呈快速下降趋势;当海拔在1 000~3 000 m时, 随着海拔的升高, PM2.5浓度呈上升趋势;当海拔高于3 000 m时, 随着海拔的升高, PM2.5浓度呈下降趋势, 5 000 m后趋于平缓.

图 7 影响因子对PM2.5年均浓度的偏依赖 Fig. 7 Partial dependency plots for the factors in the RF model predicting PM2.5 annual average concentration

年降水量[图 7(c)]与PM2.5浓度分布呈负相关关系, 当年降水量小于1 000 mm时, 对PM2.5浓度分布的影响程度急剧下降;当年降水量大于2 000 mm时, 对PM2.5浓度分布的影响程度达到最小并保持不变.年均气温[图 7(d)]与PM2.5浓度分布的关系与DEM类似:气温在0℃以下, 对PM2.5浓度分布的影响程度逐渐下降;气温在0~13℃之间, 对PM2.5浓度分布的影响程度逐渐上升;气温大于13℃, 对PM2.5浓度分布的影响程度急剧下降.PM2.5浓度与风速[图 7(e)]呈负相关关系, 当风速在0.7~2.0 m·s-1之间, 对PM2.5浓度分布的影响程度急剧下降;当风速大于3 m·s-1时, 风速对PM2.5浓度的影响程度达到最小, 并保持不变.

NDVI与PM2.5浓度分布呈负相关关系, 随着NDVI的上升, NDVI对PM2.5浓度的影响程度逐渐减小[图 7(f)].这表明中、低地表植被覆盖区的绿化工程对改善大气环境和降低PM2.5浓度的作用更加显著.PM2.5浓度分布与人口密度呈正相关, 当人口密度大于1万人·km-2时, 人口密度对PM2.5浓度分布的影响程度达到最大并保持不变[图 7(g)].类似的, PM2.5浓度分布与GDP密度呈正相关, 当GDP密度大于4万元·km-2时, GDP对PM2.5浓度分布的影响程度达到最大并保持不变[图 7(h)].

2.3 单因素对PM2.5浓度空间分布的影响

本文提出的随机森林模型同样可以量化单个因素对PM2.5浓度空间分布的影响程度.分别将各影响因素作为输入变量, 以PM2.5年均浓度值作为输出变量, 参数设置一律默认, 训练随机森林模型.模型拟合结果如图 8所示:AOD和DEM对PM2.5年均浓度的空间分布影响程度最高, NDVI和PRE的影响程度最低.按影响程度大小排序, AOD、DEM、TEM、POP、GDP、WS、NDVI和PRE分别能解释37.96%、25.91%、22.92%、11.61%、10.63%、8.63%、6.35%和5.75%的PM2.5年均浓度的空间分异.

图 8 因素交互作用对PM2.5浓度空间分布的影响 Fig. 8 Spatial influencing magnitude of individual and interactive factors on PM2.5 annual concentration

同理, 将各因素两两组合作为随机森林模型的输入变量, 以量化因素交互作用对PM2.5浓度空间分布的影响(图 8).AOD与PRE交互能够解释79.78%的PM2.5年均浓度的空间分异, AOD与NDVI(74.70%)和AOD与POP(71.86%)交互也能解释70%以上的PM2.5年均浓度空间分布.

2.4 影响因素的区域差异分析

区域差异是地理学的传统研究视角, 为探索PM2.5年均浓度影响因子的区域差异, 对不同地理分区的影响因子分别进行随机森林拟合与验证(图 9).图 9显示, 地理分区尺度下随机森林模型的测试集精度较高(R2均大于0.90), 适合进行影响因素研究.在不同地理分区, AOD可以解释44.49%~78.17%的PM2.5年均浓度的空间分异, 是影响PM2.5浓度空间分布的关键因子, 其解释率在不同地理分区的排序为:华南>西南>华北>华东>西北>华中>东北.其主要原因为经济发展水平的地区差异, 华南、华北和华东地区人口集中, 产业密集, 人为气溶胶排放量大;西南地区经济发展加速, 人为气溶胶排放增长迅速.DEM能够解释0.81%~68.15%的PM2.5浓度的空间分布, 在不同地理分区, 其影响力度依次为:西南>华北>华中>华东>西北>东北>华南.地形因素对西南地区的PM2.5浓度影响最大, 青藏高原和云贵高原的PM2.5浓度较低, 四川盆地的PM2.5浓度较高[28].

图 9 不同地理分区PM2.5年均浓度的影响因子的空间解释力度 Fig. 9 Spatial influencing magnitude of factors on PM2.5 concentration in seven geographical subareas

PRE对PM2.5浓度空间分布的解释力度普遍较弱, 在不同地理分区, 其影响力度依次为:华东、西南、西北、华中、华北、华南和东北.TEM对PM2.5浓度空间分布的解释力度在14.19%~78.57%之间, 在不同地理分区, 其影响力度排序为:华北、西南、西北、东北、华东、华中和华南.华北地区大气层结稳定, 逆温天气频发, 大气混合层高度低, 不利于污染颗粒物的扩散[29];加之采暖期燃煤排放, 导致大气污染严重[30].华南地区主要为南亚热带气候类型, 年均气温差异较小, 对PM2.5浓度空间分异的影响不大.除华北和西南外, 其它地理分区的WS对当地PM2.5浓度空间分布的解释力度均较小于1%.华北平原的年均风速较小, 加之太行山、燕山沿山地区常形成地形辐合线, 易于大气污染物的辐合积累[31].

POP能解释0.98%~60.69%的PM2.5浓度的空间分布, 华南、西北地区POP对当地PM2.5浓度空间分布的解释力度最小.类似地, 西北和华南地区GDP对当地PM2.5浓度空间分布的解释力度也最小.西北地区人类活动稀少, 经济发展水平不高, PM2.5以自然气溶胶为主;华南地区的主导产业为服务业、高新技术等第三产业, 经济发展对大气的污染较小[32].不同地理分区的NDVI对当地PM2.5浓度空间分布的解释力度最小, 除西南和西北外, 其它地理分区的NDVI对当地PM2.5浓度空间分布的解释力度均较小于5%.植被通过对大气颗粒物的净化、吸收作用有效降低PM2.5浓度, 但随着NDVI的上升, NDVI对PM2.5浓度的影响程度逐渐减小[图 7(f)].西南、西北地区荒漠化严重, 植被覆盖率较低.

3 结论

(1) 与多元回归、广义可加模型和BP神经网络相比, 利用随机森林模型估算的PM2.5浓度精度最高, 可用于PM2.5影响因素研究.

(2) PM2.5浓度与影响因素间存在非线性响应关系, PM2.5浓度随AOD、POP和GDP的增加呈先上升后平稳的趋势, 随PRE、WS和NDVI的增加呈先下降后平稳的趋势, 随DEM和TEM的增加呈下降→上升→下降的趋势.

(3) AOD对PM2.5浓度空间分布的影响最大, 可解释37.96%的PM2.5浓度空间分异;PRE对PM2.5浓度空间分布的影响最小, 解释率仅为5.75%.因子交互显著提高了影响因素对PM2.5浓度空间分布的解释力度.

(4) PM2.5浓度与影响因素间的关系存在空间异质性, 同一影响因子对不同地理分区的PM2.5浓度空间分布的影响力度存在区域差异.AOD对华南地区PM2.5浓度的空间分布影响最大, 对东北地区影响最大.

参考文献
[1] 段杰雄, 翟卫欣, 程承旗, 等. 中国PM2.5污染空间分布的社会经济影响因素分析[J]. 环境科学, 2018, 39(5): 2498-2504.
Duan J X, Zhai W X, Cheng C Q, et al. Socio-economic factors influencing the spatial distribution of PM2.5 concentrations in china:an exploratory analysis[J]. Environmental Science, 2018, 39(5): 2498-2504.
[2] 宋明, 韩素芹, 张敏, 等. 天津大气能见度与相对湿度和PM10及PM2.5的关系[J]. 气象与环境学报, 2013, 29(2): 34-41.
Song M, Han S Q, Zhang M, et al. Relationship between visibility and relative humidity, PM10, PM2.5 in Tianjin[J]. Journal of Meteorology and Environment, 2013, 29(2): 34-41.
[3] 王跃思, 张军科, 王莉莉, 等. 京津冀区域大气霾污染研究意义、现状及展望[J]. 地球科学进展, 2014, 29(3): 388-396.
Wang Y S, Zhang J K, Wang L L, et al. Researching significance, status and expectation of haze in Beijing-Tianjin-Hebei region[J]. Advances in Earth Science, 2014, 29(3): 388-396.
[4] 郭新彪, 魏红英. 大气PM2.5对健康影响的研究进展[J]. 科学通报, 2013, 58(13): 1171-1177.
Guo X B, Wei H Y. Progress on the health effects of ambient PM2.5 pollution[J]. Chinese Science Bulletin, 2013, 58(13): 1171-1177.
[5] Yang Y, Luo L W, Song C, et al. Spatiotemporal assessment of PM2.5-related economic losses from health impacts during 2014-2016 in China[J]. International Journal of Environmental Research and Public Health, 2018, 15(6): E1278.
[6] Meng C, Cheng T H, Gu X F, et al. Contribution of meteorological factors to particulate pollution during winters in Beijing[J]. Science of the Total Environment, 2019, 656: 977-985.
[7] 刘海猛, 方创琳, 黄解军, 等. 京津冀城市群大气污染的时空特征与影响因素解析[J]. 地理学报, 2018, 73(1): 177-191.
Liu H M, Fang C L, Huang J J, et al. The spatial-temporal characteristics and influencing factors of air pollution in Beijing-Tianjin-Hebei urban agglomeration[J]. Acta Geographica Sinica, 2018, 73(1): 177-191.
[8] 陆怡雅, 李闻起, 汪艺晗, 等. 基于LMDI分解方法的河北省PM2.5排放驱动因素分析[J]. 环境科学学报, 2019, 39(8): 2821-2829.
Lu Y Y, Li W Q, Wang Y H, et al. Drivers of PM2.5 emission in Hebei based on LMDI decomposition analysis[J]. Acta Scientiae Circumstantiae, 2019, 39(8): 2821-2829.
[9] 周亮, 周成虎, 杨帆, 等. 2000-2011年中国PM2.5时空演化特征及驱动因素解析[J]. 地理学报, 2017, 72(11): 2079-2092.
Zhou L, Zhou C H, Yang F, et al. Spatio-temporal evolution and the influencing factors of PM2.5 in China between 2000 and 2011[J]. Acta Geographica Sinica, 2017, 72(11): 2079-2092.
[10] Wang S J, Liu X P, Yang X, et al. Spatial variations of PM2.5 in Chinese cities for the joint impacts of human activities and natural conditions:a global and local regression perspective[J]. Journal of Cleaner Production, 2018, 203: 143-152.
[11] Tu M Z, Liu Z F, He C Y, et al. The relationships between urban landscape patterns and fine particulate pollution in China:a multiscale investigation using a geographically weighted regression model[J]. Journal of Cleaner Production, 2019, 237: 117744.
[12] 段文娇, 郎建垒, 程水源, 等. 京津冀地区钢铁行业污染物排放清单及对PM2.5影响[J]. 环境科学, 2018, 39(4): 1445-1454.
Duan W J, Lang J L, Cheng S Y, et al. Air pollutant emission inventory from Iron and steel industry in the Beijing-Tianjin-Hebei region and its impact on PM2.5[J]. Environmental Science, 2018, 39(4): 1445-1454.
[13] Jiang P, Yang J, Huang C H, et al. The contribution of socioeconomic factors to PM2.5 pollution in urban China[J]. Environmental Pollution, 2018, 233: 977-985.
[14] 罗毅, 邓琼飞, 杨昆, 等. 近20年来中国典型区域PM2.5时空演变过程[J]. 环境科学, 2018, 39(7): 3003-3013.
Luo Y, Deng Q F, Yang K, et al. Spatial-temporal change evolution of PM2.5 in typical regions of China in recent 20 years[J]. Environmental Science, 2018, 39(7): 3003-3013.
[15] 时燕, 刘瑞梅, 罗毅, 等. 近20年来中国PM2.5污染演变的时空过程[J]. 环境科学, 2020, 41(1): 1-13.
Shi Y, Liu R M, Luo Y, et al. Spatio-temporal variations of PM2.5 pollution evolution in China in recent 20 years[J]. Environmental Science, 2020, 41(1): 1-13.
[16] Qin D M, Yu J, Zou G J, et al. A novel combined prediction scheme based on CNN and LSTM for urban PM2.5 concentration[J]. IEEE Access, 2019, 7: 20050-20059.
[17] 尹晓梅, 李梓铭, 熊亚军, 等. 2014~2017北京市气象条件和人为排放变化对空气质量改善的贡献评估[J]. 环境科学, 2019, 40(3): 1011-1023.
Yin X M, Li Z M, Xiong Y J, et al. Contribution assessment of meteorology conditions and emission change for air quality improvement in Beijing during 2014-2017[J]. Environmental Science, 2019, 40(3): 1011-1023.
[18] 张海霞, 程先富, 陈冉慧. 安徽省PM2.5时空分布特征及关键影响因素识别研究[J]. 环境科学学报, 2018, 38(3): 1080-1089.
Zhang H X, Cheng X F, Chen R H. Analysis on the spatial-temporal distribution characteristics and key influencing factors of PM2.5 in Anhui Province[J]. Acta Scientiae Circumstantiae, 2018, 38(3): 1080-1089.
[19] 贺祥, 林振山. 基于GAM模型分析影响因素交互作用对PM2.5浓度变化的影响[J]. 环境科学, 2017, 38(1): 22-32.
He X, Lin Z S. Interactive effects of the influencing factors on the changes of PM2.5 concentration based on GAM model[J]. Environmental Science, 2017, 38(1): 22-32.
[20] Li J M, Jin M J, Li H L. Exploring spatial influence of remotely sensed PM2.5 concentration using a developed deep convolutional neural network model[J]. International Journal of Environmental Research and Public Health, 2019, 16(3): 454.
[21] Zhong J T, Zhang X Y, Wang Y Q. Relatively weak meteorological feedback effect on PM2.5 mass change in Winter 2017/18 in the Beijing area:observational evidence and machine-learning estimations[J]. Science of the Total Environment, 2019, 664: 140-147.
[22] 王超, 阚瑷珂, 曾业隆, 等. 基于随机森林模型的西藏人口分布格局及影响因素[J]. 地理学报, 2019, 74(4): 664-680.
Wang C, Kan A K, Zeng Y L, et al. Population distribution pattern and influencing factors in Tibet based on random forest model[J]. Acta Geographica Sinica, 2019, 74(4): 664-680.
[23] Ye T T, Zhao N Z, Yang X C, et al. Improved population mapping for China using remotely sensed and points-of-interest data within a random forests model[J]. Science of the Total Environment, 2019, 658: 936-946.
[24] Van Donkelaar A, Martin R V, Brauer M, et al. Global estimates of fine particulate matter using a combined geophysical-statistical method with information from satellites, models, and monitors[J]. Environmental Science & Technology, 2016, 50(7): 3762-3772.
[25] Breiman L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.
[26] Guidotti R, Monreale A, Ruggieri S, et al. A survey of methods for explaining black box models[J]. ACM Computing Surveys, 2019, 51(5): 93.
[27] Hastie T, Tibshirani R. Generalized additive models[J]. Statistical Science, 1986, 1(3): 297-310.
[28] 卢德彬, 毛婉柳, 杨东阳, 等. 基于多源遥感数据的中国PM2.5变化趋势与影响因素分析[J]. 长江流域资源与环境, 2019, 28(3): 651-660.
Lu D B, Mao W L, Yang D Y, et al. Analysis on the trend and influencing factors of PM2.5 in China based on multi-source remote sensing data[J]. Resources and Environment in the Yangtze Basin, 2019, 28(3): 651-660.
[29] 张莹, 王式功, 贾旭伟, 等. 华北地区冬半年空气污染天气客观分型研究[J]. 环境科学学报, 2018, 38(10): 3826-3833.
Zhang Y, Wang S G, Jia X W, et al. Study on an objective synoptic typing method for air pollution weather in North China during winter half year[J]. Acta Scientiae Circumstantiae, 2018, 38(10): 3826-3833.
[30] 周曙东, 欧阳纬清, 葛继红. 京津冀PM2.5的主要影响因素及内在关系研究[J]. 中国人口·资源与环境, 2017, 27(4): 102-109.
Zhou S D, Ouyang W Q, Ge J H. Study on the main influencing factors and their intrinsic relations of PM2.5 in Beijing-Tianjin-Hebei[J]. China Population, Resources and Environment, 2017, 27(4): 102-109.
[31] 苏福庆, 任阵海, 高庆先, 等. 北京及华北平原边界层大气中污染物的汇聚系统——边界层输送汇[J]. 环境科学研究, 2004, 17(1): 21-25, 33.
Su F Q, Ren Z H, Gao Q X, et al. Convergence system of air contamination in boundary layer above Beijing and North China:transportation convergence in boundary layer[J]. Research of Environmental Sciences, 2004, 17(1): 21-25, 33.
[32] 韩婧, 李元征, 陈新闯, 等. 基于灰色关联模型的中国城镇PM2.5浓度影响因素分析[J]. 环境保护科学, 2018, 44(3): 69-73, 79.
Han J, Li Y Z, Chen X C, et al. Analysis of the influencing factors of PM2.5 concentration in the urban areas of China's towns based on grey correlation model[J]. Environmental Protection Science, 2018, 44(3): 69-73, 79.