环境科学  2022, Vol. 43 Issue (3): 1235-1245   PDF    
中国地表臭氧浓度估算及健康影响评估
赵楠1,2,3, 卢毅敏1,2,3     
1. 数字中国研究院(福建), 福州 350003;
2. 福州大学福建省数字区域工程技术研究中心, 福州 350108;
3. 福州大学空间数据挖掘与信息共享教育部重点实验室, 福州 350108
摘要: 在PM2.5浓度逐年下降的背景下,臭氧浓度不降反升,臭氧已成为中国暖季的主要污染物之一.基于大数据关联分析思路,构建并开发了极限梯度提升(XGBoost)臭氧浓度估算模型,用以估算2019年中国每日最大8 h平均臭氧浓度(O3_8h),用于人类暴露评估.该模型输入地面监测站点数据、高分辨率遥感卫星数据、气象数据、排放清单数据、数字高程模型(DEM)数据和人口数据,捕捉O3_8h的时空变化.本研究采用十折交叉验证的方式评估模型的估算性能(R2为0.871,RMSE为11.7 μg·m-3),与随机森林模型(RF)和核岭回归模型(KRR)相比,由于算法本身的提升和并行处理的推进,使得XGBoost模型估算结果表现出更高的准确性(RF:R2为0.864,RMSE为12.387 μg·m-3;KRR:R2为0.582,RMSE为23.1 μg·m-3)且模型运算效率明显提升.同时对中国各省市人口臭氧暴露水平和归因于臭氧暴露的慢性阻塞性肺部疾病(COPD)死亡相对风险进行评估,结果表明,在超标天数上,非达标天数排在前五的有山东省、河南省、河北省、安徽省和宁夏回族自治区;在暴露强度上,人口加权臭氧浓度排在前五的有河北省、山东省、山西省、天津市和江苏省;在健康影响上,COPD死亡相对风险表现出季节变化,夏季最高,冬季最低.
关键词: 地表臭氧      极限梯度提升算法(XGBoost)      对流层观测仪(TROPOMI)      人口暴露      慢性阻塞性肺部疾病     
Estimation of Surface Ozone Concentration and Health Impact Assessment in China
ZHAO Nan1,2,3 , LU Yi-min1,2,3     
1. Academy of Digital China(Fujian), Fuzhou 350003, China;
2. Digital Region Engineering Technology Research Center in Fujian Province, Fuzhou University, Fuzhou 350108, China;
3. Key Laboratory of Spatial Data Mining & Information Sharing, Ministry of Education, Fuzhou University, Fuzhou 350108, China
Abstract: Within the context of PM2.5 concentrations decreasing annually, ozone concentrations have increased instead of decreased, and ozone has become one of the main pollutants in the warm season in China. Based on the idea of big data association analysis, the extreme gradient boosting (XGBoost) ozone concentration estimation model was constructed and developed to estimate the maximum daily 8 h average ozone concentration (O3_8h) in China in 2019 for human exposure assessment. The model input ground monitoring station data, high-resolution remote-sensing satellite data, meteorological data, emission inventory data, digital elevation model (DEM) data, and population data were used to capture the temporal and spatial variation of O3_8h. In this study, ten-fold cross-validation was used to evaluate the estimation performance of the model (R2=0.871, RMSE=11.7 μg·m-3). Compared to those with the random forest (RF) model and kernel ridge regression (KRR) model, due to the improvement in the algorithm itself and the advancement of parallel processing, the estimation results of the XGBoost model showed higher accuracy (RF: R2=0.864, RMSE=12.387 μg·m-3). The KRR model was as follows: R2=0.582, RMSE=23.1 μg·m-3, and the computational efficiency of the model was significantly improved. At the same time, the level of ozone exposure and the relative risk of death due to chronic obstructive pulmonary disease (COPD) in China's provinces and cities were evaluated. The results showed that the top five number of days exceeding the standard occurred in Shandong Province, Henan Province, Hebei Province, Anhui Province, and the Ningxia Hui Autonomous Region. In terms of exposure intensity, Hebei Province, Shandong Province, Shanxi Province, Tianjin City, and Jiangsu Province ranked the top five in terms of population weighted ozone concentration. In terms of health effects, the relative risk of COPD death showed seasonal changes, with the highest in summer and the lowest in winter.
Key words: surface ozone      extreme gradient boosting(XGBoost)      TROPOMI      population exposure      chronic obstructive pulmonary disease     

随着城市化和工业化的快速推进, 我国在调整产业结构的同时, 大气污染问题已由传统的化石燃料燃烧引起的单一污染物污染逐渐转变为由多种污染物共同作用而形成的复合型污染[1~6].作为一种由光化学反应生成的二次污染物, 臭氧(O3)对人体和动植物的健康产生严重危害.长期暴露于高浓度臭氧中会降低肺功能, 从而导致哮喘、肺气肿和肺癌等呼吸系统疾病[7, 8].当前已有研究结果肯定了大气污染与人类死亡之间存在联系, 特别是在肺部疾病与心血管疾病之间存在显著关联性[9~13]. 因此, 有必要开发一种有效的方法来准确估算高分辨率臭氧浓度, 进而评估其对健康的影响.

越来越多的学者采用地面监测站点数据研究中国上空臭氧污染状况[14~17], 但是由于地面监测站点代表的面积有限(0.26~16.25 km2), 而且分布不均匀, 这大大提高了臭氧研究的不确定性[18~20].随着航天卫星遥感技术的不断发展, 卫星遥感数据为估算高时空分辨率地表臭氧浓度提供了前所未有的机会, 但是臭氧柱量经常存在缺失, 且低覆盖的臭氧柱对时空变化的响应有限, 导致对地表臭氧浓度估算效果较差, 不利于健康风险评价[21, 22].李一蜚[23]的研究利用GBRT算法, 对中国区域近地面臭氧浓度进行了估算, 其结果较为理想(R2=0.89、RMSE=4.75 μg·m-3), Li等[24]的研究利用卫星遥感数据估算海南岛近地面臭氧浓度并对健康影响进行评价, 得出XGBoost模型与随机森林、广义回归神经网络和BP神经网络和克里金插值等方法相比, 具有明显的优势(R2=0.59, RMSE=24.14 μg·m-3).但是上述方法仍然有改进空间.

对此, 本研究在高时空分辨率遥感卫星产品的支持下, 采用XGBoost(extreme gradient boosting)回归算法融合多源地理协变量, 结合大数据关联的思想, 提出一种地表臭氧浓度高精度估算方法, 从而获取全覆盖高精度的地表臭氧浓度数据, 并对中国各城市的人口加权O3水平、非达标日和2019年臭氧暴露与COPD死亡之间的相对风险进行评估, 旨在为流行病学研究和生态系统安全提供基础数据.

1 材料与方法 1.1 数据来源与处理

本文使用地面站点监测数据、高分辨率卫星遥感数据(TROPOMI_NO2)、排放清单数据、气象数据和其他地理协变量(DEM数据、人口数据)参与建模.

地面臭氧监测数据来源于2019年1月1日到2019年12月31日的中国环境监测总站全国城市空气质量实时发布平台(http://106.37.208.233:20035/)发布的全国1 605个国控监测站点逐小时数据.本文按照《环境空气质量标准》(GB 3095_2012)[25]的有关规定选取评价指标, 日评价指标采用臭氧日最大8h滑动平均浓度(O3_8h).月评价指标则是将每月大于27个有效的O3_8h浓度值的站点和2月大于25个有效的O3_8h浓度值的站点计算每个站点的月平均值.将O3日最大8 h滑动平均浓度第90百分位数的浓度值(O3_8h_P90)作为臭氧年评价指标.依据《环境空气质量指数(AQI)技术规定(试行)》(HJ 633-2012)[26], 臭氧日最大8h滑动平均浓度的一级限值为100 μg·m-3, 二级限值为160 μg·m-3, 臭氧浓度超过160 μg·m-3则认为超标. 2019年中国区域臭氧监测站点分布如图 1所示.

监测站点未包含中国香港、澳门和台湾数据 图 1 2019年中国区域臭氧监测站点分布 Fig. 1 Distribution map of China's ozone monitoring stations in 2019

同期高分辨率卫星数据来自对流层环境监测网(http://www.temis.nl/protocols/tropo.html)提供的NO2柱浓度逐日数据集.TROPOMI传感器于2017年伴随哨兵5号先导卫星(Sentinel-5P)发射升空, 与目前仍在轨运行的OMI传感器相比, TROPOMI的技术性能大幅提升, 空间分辨率显著升高(OMI: 13 km, TROPOMI: 7 km×3.5 km).TROPOMI的NO2数据与OMI数据相比, 层次更加分明, 图像中水平条带和垂直条带消失, 连续性和平滑性更好, 细节特征较为丰富, 空间表现力更强[27~30].

对于近地面臭氧浓度估算, 气象因素是十分重要的影响因素之一, 气象因素参与建模可以在一定程度上提高估算的准确性和可靠性.有研究表明, 2 m温度、地表压力、边界层高度、总柱臭氧、10 m纬向风和10 m经向风与臭氧浓度密切相关[31~33].本文采用的气象数据来自欧洲中尺度预测中心(European Center for Medium-Range Weather Forecasts, ECMWF)提供的era5逐小时数据集, 网址为https://www.ecmwf.int/, 该数据集是ECMWF推出的第五代全球大气再分析产品, 相比于ERA-Interim模式数据集, era5加入了新的参数而且可以在较短的时间内进行更好的分析, 对较长的预测区间来说改进的预报模式会提高数据的精度和准确性.

臭氧前体物浓度数据采用清华大学MEIC模型团队开发的亚洲排放清单产品MIX[34~36].自2008年开始, MEIC每两年会更新一次数据, 最新的年份为2016年.由于中国2019年的排放清单在本研究进行时尚未公开, 因此采用MIX提供的2016年的排放清单数据, 分辨率为0.25°×0.25°.本文主要采用SO2、NOx、NH3、CO、OC和NMVOC参与建模.

其他地理协变量主要包括人口数据和DEM数据.人口数据来自开放空间人口统计数据与研究网站(https://www.worldpop.org/), 它旨在为中美洲和南美洲, 非洲和亚洲提供一个开放的空间人口统计据集存档, 以支持发展, 灾害应对和卫生应用.本文使用该网站提供的2019年格网化人口数据, 分辨率为0.01°×0.01°. DEM数据来自地理空间数据云平台(http://www.gscloud.cn/)提供的30 m分辨率数据.

本文首先对原始数据进行筛选计算(筛选保留每个月大于27个有效的O3_8h的站点和2月大于25个有效的O3_8h的站点), 经整理抽取后将投影坐标统一为1980 Albers投影, 采用空间插值的方法将除地面站点数据外的4种数据类型(排放清单数据、气象数据、DEM数据和人口数据)共15种特征数据按如下方法统一重采样至中国区域0.05°的目标格网中: ①根据研究区的经纬度范围划分格网, 设置分别率为0.05°×0.05°, 并计算每个格网点的中心坐标, ②计算每个格网的中心与原图像中每个像元中心的欧式距离, ③获取欧氏距离小于0.025°的所有的像元值, 将其平均值赋给该像元; 然后以日作为时间尺度, 采用空间连接的方法将站点监测臭氧数据与格点数据进行时间和空间匹配, 向量化后以列的形式拼接制作臭氧浓度估算数据集.数据集中的每一列都对应一种特征.

本文最终处理后的数据集包含了18列, 包括地面监测站点的臭氧浓度值、经度、纬度、高分辨率遥感数据(TROPOMI_NO2)、2 m温度(T2m)、边界层高度(BLH)、地表压力(SP)、10 m纬向风(u10)、10 m经向风(v10)和二氧化硫(SO2)、氮氧化物(NOx)、氨气(NH3)、一氧化碳(CO)、挥发性有机化合物(NMVOC)、有机碳(OC)、总柱臭氧(TCO3)人口数据(POP)和DEM数据(图 2), 其中地面监测站点臭氧浓度值主要用来做验证, 经度和纬度用来进行格网点和站点的匹配, 其他数据作为特征输入模型中进行估算训练.最终所构建的样本数据集包含434 160个样本点.

图 2 数据预处理流程 Fig. 2 Pre-processing of the experimental dataset

1.2 XGBoost模型构建

XGBoost又称极限梯度提升算法, 是由Chen等[37]提出的一种高级统计模型, 其核心思想是: 构造一定数量的决策树, 在每构造一棵决策树的过程中, 模型会学习一个新的损失函数去拟合上次估算的残差, 依次进行下去直到构建完成K棵决策树为止.XGBoost模型是梯度提升算法的改进, 它采用二阶泰勒展开式求解损失函数而且损失函数中还加入了正则化项, 因此XGBoost的目标函数由两部分组成, 一是算法本身的损失; 二是正则化项.本文通过构建430棵决策树建立估算O3_8h的XGBoost模型.步骤如下: ①将纯空间估算变量(如高程)与时空估算变量(如温度)和O3_8h观测值进行站点和格网点的匹配连接.得到一个统一的训练表, 每一行记录O3_8h的观测值和相应的估算变量数据. ②生长一棵回归树.从单个节点开始, 然后重复以下步骤, 直到每个终端节点中只有一个数据点.首先, 对估算变量抽样.随机选择三分之一的估算变量来减少树之间的相关性.其次, 分裂搜索.在选定的估算变量中搜索最能降低引导样本的平方误差的分割. ③通过构建430棵回归树形成XGBoost模型, 将每棵树的每个叶子节点得分加起来得到最终的估算得分.

与其他黑箱机器学习模型相比, XGBoost模型可以实现更快的模型探索且消耗更少的计算资源, 同时XGBoost模型能够准确捕捉各种估算变量的非线性特征.由于在损失函数中加入了正则化项, 所以一般可以避免过拟合现象.XGBoost模型的损失函数如下:

(1)
(2)

式中, 为损失函数, 为正则化项. 为估算值, yi为样本标签, fk代表第k棵树, T代表树的叶子节点数, ω为叶子权重值, γ为叶子树惩罚正则项, 具有剪枝作用, λ为叶子权重惩罚正则项, 用于防止过拟合.

本文调用Python语言自带的XGBRegressor库来构建XGBoost模型, 模型构建过程中设定了9个重要参数, 分别为num_round、subsample、eta、gamma、max_depth、min_child_weigth、reg_alpha、reg_lambda和colsample_bytree.通过多种参数的共同作用防止模型在估算过程中出现过拟合现象, 提高模型估算的准确性.

1.3 XGBoost模型评价

为评价XGBoost模型在地表臭氧浓度估算中的性能, 本文对XGBoost模型与Bagging族中的随机森林模型(random forest, RF)和广义线性回归模型中的核岭回归模型(kernel ridge regression, KRR)做比较, 采用十折交叉验证的方式进行评价[38~40].将训练估算数据集近似均匀的分为10份, 随机选取90%作为训练集和剩余10%作为验证集输入各个模型中进行拟合, 训练和估算过程依次重复10次, 以保证每一个观测数据都有一个估算数据与其对应.在整个模型评价过程中, 采用R2和RMSE评价模型估算的性能.

1.4 臭氧人口加权暴露

使用XGBoost模型估算每个网格每日的O3_8h浓度值, 结合该网格内的人口数量, 估算每一网格内的臭氧人口加权暴露水平, 具体公式与方法如下[41]:

(3)

式中, cwp为全区域人口加权的每日臭氧浓度, Pi为格网i中的人口数, ci为格网i中估算的每日臭氧浓度水平.

以往的队列研究发现, 长期室外环境空气污染暴露与对人类健康的不利影响之间存在关联, 特别是与呼吸道和心血管健康疾病关联更为密切.本研究采用慢性阻塞性肺部疾病(chronic obstructive pulmonary disease, COPD)作为死亡的疾病终点, 由暴露-反应关系计算臭氧暴露与COPD死亡的相对风险值, 基于中国各省的臭氧暴露浓度, 应用暴露反应关系[即臭氧浓度每升高约10 μg·m-3, COPD的超额死亡风险增加约1.4%(95%CI: 0.2% ~5.3%)], 得到2019年臭氧暴露与COPD死亡之间的相对风险值, 计算公式如下:

(4)

式中, RR为在臭氧浓度暴露的情况下, COPD死亡的相对风险值, β为暴露-反应系数, Δx为臭氧浓度超过100 μg·m-3的浓度, 若臭氧浓度低于100 μg·m-3, 则认为臭氧暴露对人体健康没有影响.

2 结果与分析 2.1 模型估算性能分析

研究区2019年1月~2019年12月模型估算O3_8h的十折交叉验证结果如图 3所示, 结果表明3种机器学习模型中XGBoost模型估算结果与地面站点监测结果吻合度较高, R2为0.871, RMSE为11.7 μg·m-3, 相比之下, 随机森林模型的拟合效果相对较差, R2为0.864, RMSE为12.387 μg·m-3, 核岭回归算法估算结果与地面站点监测结果相差较远, 并且R2最低为0.582, RMSE最高为23.1 μg·m-3.十折交叉验证的差异表明, 相比于随机森林模型和核岭回归模型, XGBoost模型能更好地捕捉O3_8h与各影响因素之间复杂的非线性关系, 模型拟合精度显著提升.与随机森林模型和核岭回归模型相比, XGBoost模型估算结果更加可靠; 从斜率的角度来看, XGBoost模型的斜率更大, 截距更小, 说明XGBoost模型在一定程度上可以减轻低估现象.

图 3 3种机器学习模型十折交叉验证散点图 Fig. 3 Scatter diagrams of three machine learning models with ten-fold cross-validation

为进一步分析XGBoost模型对地表臭氧浓度估算的合理性和准确性, 本文从季均和年均的角度对XGBoost模型、随机森林模型和核岭回归模型的估算结果进行评价(见表 1), 3种模型的十折交叉验证精度随季节的变化而变化.从交叉验证的角度来看, 年均XGBoost模型十折交叉验证的R2为0.86, 季均XGBoost模型十折交叉验证的R2在0.76~0.86之间; 年均随机森林模型十折交叉验证的R2为0.84, 季均随机森林模型十折交叉验证的R2在0.66~0.81之间; 年均核岭回归模型十折交叉验证的R2为0.56, 季均核岭回归模型十折交叉验证的R2在0.52~0.71之间.XGBoost模型的估算性能显著优于随机森林模型和核岭回归模型且3种模型均表现为夏秋季节模型性能优于春冬季节.

表 1 季均、年均XGBoost/RF/KRR模型精度验证 Table 1 Comparison of model fitting and cross-validation results for the XGBoost and RF and KRR models

同时, 绘制3种模型估算的地表年平均臭氧浓度空间分布(图 4), 依据表 1图 4, 通过与真实地面监测站点臭氧浓度对比, 从而对模型估算性能进行评价.表 1中的站点实测数值显示2019年地表臭氧浓度具有季节性差异, XGBoost估算结果与实测值最为接近, 且标准差(SD)普遍低于实测数据的标准差, 因此XGBoost模型更能反映地表臭氧浓度之间的内部差异.从空间分布的角度来看, 3种机器学习模型估算的臭氧浓度具有相同的空间分布趋势, 且与真实值的空间分布趋势相符.图 3的散点图和图 4的空间分布图得出了相同的结论, 即采用机器学习算法估算地表臭氧浓度具有明显的低估现象, 但是XGBoost模型可以有效地改善低估.

(a)不包含“中国香港、澳门和台湾”数据, (b)、(c)和(d)包含“中国香港、澳门和台湾”数据 图 4 2019年中国O3年平均浓度空间估算结果 Fig. 4 Estimates of the annual mean O3 across China in 2019

2019年臭氧浓度年平均值最高的地区集中在华北平原和长江中下游平原, 其中山西省的东部、河北省的南部、河南省的北部和山东省的西部是污染最严重的地区, 其年平均臭氧浓度在117 μg·m-3以上.这是因为这4个省是人口大省且工业密集, 由化石燃料和机动车尾气排放的臭氧前体物较多.另外, 内蒙古西部、甘青新交界和西藏西部等地也聚集了相当高的臭氧浓度.从空间的角度来看, 西部地区是典型的气象较敏感性区域, 温度和太阳辐射在臭氧对气象敏感性的空间分布上起着主导性作用.从污染物传输角度来看, 外围传输在长期范围内均呈现上升趋势且在西北和中部地区外围传输高值聚集.臭氧浓度低值聚集区主要集中在海南、黑龙江和辽宁等地区, 其年平均浓度低于61 μg·m-3.

2.2 臭氧人口加权暴露分析

图 5图 6反映了2019年各省O3浓度超标天数和人口加权臭氧浓度值.其中臭氧超标天数超过全年天数52%的省份有山东省(204 d)、河南省(203 d)、河北省(197 d)、安徽省(195 d)和宁夏回族自治区(191 d), 长期暴露于高浓度的臭氧中, 会对人体和动植物的健康产生严重的影响.臭氧超标天数低于全年天数25%的省份有广西壮族自治区(84 d)、云南省(83 d)、黑龙江省(82 d)、贵州省(78 d)和海南省(37 d), 这些省份空气质量相对较好, 受臭氧影响相对较小.由此可见, 臭氧超标天数在时空分布上所表现出的特点和规律与模型估算臭氧浓度值的时空分布非常相似.

包含“中国香港、澳门和台湾”数据 图 5 2019年各省臭氧浓度超标天数及2019年各省人口加权O3浓度值 Fig. 5 Total days of O3 concentration exceeding 100 μg·m-3 in each province and the population-weighted O3 concentration values of the provinces in 2019

图 6 2019年各省臭氧浓度超标天数及2019年各省人口加权O3浓度值 Fig. 6 Column chart of the total number of days in 2019 when O3 concentration exceeded 100 μg·m-3 in each province and the population-weighted O3 concentration value in 2019 in each province

在人口加权臭氧浓度值方面, 我国超过105 μg·m-3的省市有河北省(109.91 μg·m-3)、山东省(109.24 μg·m-3)、山西省(106.30 μg·m-3)、天津市(105.92 μg·m-3)、江苏省(105.56 μg·m-3)、河南省(105.54 μg·m-3)和北京市(105.31 μg·m-3), 这些城市有共同的特点, 即人口在全国总人口中占比较大, 工业发达, 生产生活主要依赖化石燃料燃烧, 汽车尾气产生的臭氧前体物排放量较大, 从而导致了臭氧污染较为严重.而人口加权臭氧浓度低于80 μg·m-3的省市有重庆市(78.94 μg·m-3)、贵州省(78.79 μg·m-3)、广西壮族自治区(77.38 μg·m-3)和海南省(74.88 μg·m-3), 这些城市主要以农业、轻工业为主, 城市植被覆盖水平较高、人口相对较少且分布稀疏, 臭氧前体物排放也相对较少.从而人口加权臭氧浓度较低.

2.3 COPD死亡相对风险评价

量化各省臭氧暴露与COPD死亡之间的相对风险, 有利于公众加强健康防护意识, 并为制定环境保护和公共卫生政策提供理论依据和数据支撑.COPD死亡相对风险的空间分析结果显示(图 7表 2), 归因于臭氧暴露的各省COPD死亡相对风险表现出明显的季节特征, RR(1.116)>RR(1.118)>RR(1.086)>RR(0.979).春季RR在河北省、北京市、天津市、山西省、辽宁省、上海市、江苏省、山东省、河南省、重庆市和青海省表现出了较高的数值, 这说明春季这些省市COPD死亡相对风险受臭氧暴露影响较大; 虽然夏季各省归因于臭氧暴露的COPD死亡相对风险的平均值最大, 但是河北省、北京市、天津市、山西省、上海市、江苏省、山东省和河南省的COPD死亡相对风险值仍然位于全国前列, 这可能一是因为这些省市的人口众多, 生产生活所排放的臭氧前体物较多; 二是因为这些城市的工业发达或者城市化水平较高, 臭氧浓度较大; 秋季河北省、江苏省、山东省和广东省COPD死亡相对风险受臭氧暴露影响较大, 此外西部地区也出现了较高的RR值, 这是因为西部地区受太阳直射时间长, 有利于臭氧前体物经过化学变化产生臭氧; 冬季绝大多数城市COPD死亡相对风险受臭氧暴露影响较小或没有影响, 因为这个季节温度低, 雨雪、大风天气频发, 不利于臭氧的聚集.综合以上分析发现, 臭氧暴露水平高、人口多、城市化水平高、太阳直射时间长等综合因素导致了一些地区归因于臭氧暴露的COPD死亡相对风险较大, 未来应该在这些人口密度大, 城市化水平高, 疾病负担严重的地区加强臭氧排放的监管力度, 从而减少臭氧污染, 降低由于臭氧暴露导致的COPD死亡相对风险.

包含“中国香港、澳门和台湾”数据 图 7 不同季节全国COPD死亡相对风险空间分布 Fig. 7 Spatial distribution of relative risk of COPD death in different seasons

表 2 不同季节各省COPD死亡相对风险 Table 2 Relative risk of COPD deaths in provinces in different seasons

3 讨论

本文将大数据关联思想与多源遥感数据相结合, 构建一种高精度的臭氧浓度估算模型并对臭氧人口加权暴露和COPD死亡相对风险进行评价.基于XGBoost模型估算结果, 年均臭氧浓度表现出明显的空间差异, 即在山西省的东部、河北省的南部、河南省的北部和山东省的西部臭氧浓度较大, 污染较为严重.众所周知, 对流层中的O3是由某些前体物(如NOx和VOC)通过光化学反应形成的, 石化行业和有色冶炼等大部分能源密集型行业主要分布在华北地区, 导致该地区VOC等臭氧前体物排放量较高[42].此外, 人口在山东省、河南省分布密集, 居民燃煤和其他人为排放增加了挥发性有机化合物的排放, 从而导致臭氧浓度较大, 污染严重[43].相比之下, 工业活动减少会使前体物排放减少, 使得臭氧浓度较低.此外, 与其他地区相比, 东南沿海地区的自然森林覆盖在污染物防治方面显示出较高的价值.有研究表明[44, 45].森林的树木覆盖会削弱O3污染.除此之外, 气象因素对臭氧污染也有显著影响, 如降水可以冲刷并降低臭氧浓度; 风有助于臭氧的消散.

虽然在本研究中XGBoost模型显示出了令人满意的估算性能, 但是本文的结果仍然具有不确定性: 健康影响评估没有使用局部参数.在本研究中, 使用了中国272个城市O3污染的最新暴露-反应系数, 该系数可能并不会完美地适合于所有地区.较为遗憾的是, 当前无法根据参考文献获得局部参数, 在今后的研究中, 应结合每日死亡率和估算的O3_8h浓度来估算中国区域各城市的局部暴露-反应系数, 为更好的分析臭氧对人类健康的影响提供理论依据和数据支撑.

4 结论

(1) 本研究结果表明, 采用XGBoost算法估算地表臭氧浓度值与随机森林算法和核岭回归算法相比具有明显的优势, 基于日均样本的十折交叉验证结果表明: R2为0.871, RMSE为11.7 μg·m-3.XGBoost模型估算结果与实测数据具有相同的空间分布趋势, 并且可以有效地改善低估现象.

(2) 臭氧人口加权暴露分析结果表明: 污染天数排在前五的是山东省、河南省、河北省、安徽省和宁夏回族自治区, 这些省市的臭氧超标天数超过了全年天数的52%; 而广西壮族自治区、云南省、黑龙江省、贵州省和海南省的臭氧污染天数低于全年总天数的25%.河北省、山东省、山西省、天津市、江苏省、河南省和北京市的臭氧浓度较高, 超过了105 μg·m-3; 而重庆市、贵州省、广西壮族自治区和海南省的臭氧浓度较低, 低于80 μg·m-3.

(3) 归因于臭氧暴露的各省COPD死亡相对风险表现出明显的季节特征, RR>RR>RR>RR, 春季RR在河北省、北京市、天津市、山西省、辽宁省、上海市、江苏省、山东省、河南省、重庆市和青海省表现出了较高的数值; 夏季河北省、北京市、天津市、山西省、上海市、江苏省、山东省和河南省的COPD死亡相对风险值仍然位于全国前列; 秋季河北省、江苏省、山东省和广东省的COPD死亡相对风险较高; 冬季全国各省市归因于臭氧暴露的COPD死亡相对风险较小或者没有风险.

(4) 这些数据可为环境保护部门对我国环境污染治理提供数据支持, 为健康卫生组织等相关部门对由臭氧污染引起的流行性疾病的预防治理提供合理和可靠的依据.

参考文献
[1] 张天奇, 高阳. 气候变化和污染源对中国华北地区臭氧的影响[J]. 中国海洋大学学报, 2021, 51(3): 100-109.
Zhang T Q, Gao Y. The impact of climate change and emissions on ozone in North China[J]. Periodical of Ocean University of China, 2021, 51(3): 100-109.
[2] Chen K, Zhou L, Chen X D, et al. Acute effect of ozone exposure on daily mortality in seven cities of Jiangsu Province, China: no clear evidence for threshold[J]. Environmental Research, 2017, 155: 235-241. DOI:10.1016/j.envres.2017.02.009
[3] Yang L J, Xu H Q, Jin Z F. Estimating ground-level PM2.5over a coastal region of China using satellite AOD and a combined model[J]. Journal of Cleaner Production, 2019, 227: 472-482. DOI:10.1016/j.jclepro.2019.04.231
[4] 黄晓军, 祁明月, 李艳雨, 等. 关中地区PM2.5时空演化及人口暴露风险[J]. 环境科学, 2020, 41(12): 5245-5255.
Huang X J, Qi M Y, Li Y Y, et al. Spatio-temporal evolution and population exposure risk to PM2.5 in the Guanzhong area[J]. Environmental Science, 2020, 41(12): 5455-5255.
[5] Lee J B, Cha J S, Hong S C, et al. Projections of summertime ozone concentration over East Asia under multiple IPCC SRES emission scenarios[J]. Atmospheric environment, 2015, 106: 335-346. DOI:10.1016/j.atmosenv.2015.02.019
[6] Lei R Q, Zhu F R, Cheng H, et al. Short-term effect of PM2.5/O3 on non-accidental and respiratory deaths in highly polluted area of China[J]. Atmospheric Pollution Research, 2019, 10(5): 1412-1419. DOI:10.1016/j.apr.2019.03.013
[7] 曾贤刚, 阮芳芳, 姜艺婧. 中国臭氧污染的空间分布和健康效应[J]. 中国环境科学, 2019, 39(9): 4025-4032.
Zeng X G, Ruan F F, Jiang Y J. Spatial distribution and health effects of ozone pollution in China[J]. China Environmental Science, 2019, 39(9): 4025-4032. DOI:10.3969/j.issn.1000-6923.2019.09.051
[8] 廖志恒, 范绍佳. 2006~2012年珠江三角洲地区O3污染对人群健康的影响[J]. 中国环境科学, 2015, 35(3): 897-905.
Liao Z H, Fan S J. Human health impact of exposure to ozone pollutant in Pearl River Delta region during 2006~2012[J]. China Environmental Science, 2015, 35(3): 897-905.
[9] Cohen A J, Brauer M, Burnett R, et al. Estimates and 25-year trends of the global burden of disease attributable to ambient air pollution: an analysis of data from the Global Burden of Diseases Study 2015[J]. The Lancet, 2017, 389(10082): 1907-1918. DOI:10.1016/S0140-6736(17)30505-6
[10] Cakmak S, Hebbern C, Pinault L, et al. Associations between long-term PM2.5 and ozone exposure and mortality in the Canadian Census Health and Environment Cohort (CANCHEC), by spatial synoptic classification zone[J]. Environment International, 2018, 111: 200-211. DOI:10.1016/j.envint.2017.11.030
[11] 刘启明, 方月敏, 黄志勇, 等. 大气臭氧污染的生物学指标监测评价[J]. 生态环境学报, 2011, 20(4): 612-615.
Liu Q M, Fang Y M, Huang Z Y, et al. Biological indicators for air quality assessment effects of ozone[J]. Ecology and Environment, 2011, 20(4): 612-615. DOI:10.3969/j.issn.1674-5906.2011.04.004
[12] Guo Y M, Zeng H M, Zheng R S, et al. The association between lung cancer incidence and ambient air pollution in China: a spatiotemporal analysis[J]. Environmental Research, 2016, 144: 60-65. DOI:10.1016/j.envres.2015.11.004
[13] Bell M L. The use of ambient air quality modeling to estimate individual and population exposure for human health research: a case study of ozone in the Northern Georgia Region of the United States[J]. Environment International, 2006, 32(5): 586-593. DOI:10.1016/j.envint.2006.01.005
[14] Li R, Cui L L, Li J L, et al. Spatial and temporal variation of particulate matter and gaseous pollutants in China during 2014-2016[J]. Atmospheric Environment, 2017, 161: 235-246. DOI:10.1016/j.atmosenv.2017.05.008
[15] 程麟钧, 王帅, 宫正宇, 等. 京津冀区域臭氧污染趋势及时空分布特征[J]. 中国环境监测, 2017, 33(1): 14-21.
Cheng L J, Wang S, Gong Z Y, et al. Pollution trends of ozone and its characteristics of temporal and spatial distribution in Beijing-Tianjin-Hebei region[J]. Environmental Monitoring in China, 2017, 33(1): 14-21.
[16] 尹稚祯, 王兴磊. 珠三角城市群臭氧浓度时空变化特征分析[J]. 复旦学报(自然科学版), 2020, 59(6): 748-760.
Yin Z Z, Wang X L. Analysis of the spatial and temporal variation characteristics of ozone concentration in the pearl river delta urban agglomerations[J]. Journal of Fudan University (Natural Science), 2020, 59(6): 748-760.
[17] Shi X Q, Zhao C F, Jiang H J, et al. Spatial representativeness of PM2.5 concentrations obtained using observations from network stations[J]. Journal of Geophysical Research: Atmospheres, 2018, 123(6): 3145-3158. DOI:10.1002/2017JD027913
[18] Adam-Poupart A, Brand A, Fournier M, et al. Spatiotemporal modeling of ozone levels in quebec (Canada): a comparison of kriging, Land-Use Regression (LUR), and combined bayesian maximum Entropy-LUR approaches[J]. Environmental Health Perspectives, 2014, 122(9): 970-976. DOI:10.1289/ehp.1306566
[19] Madaniyazi L, Nagashima T, Guo Y M, et al. Projecting ozone-related mortality in East China[J]. Environment International, 2016, 92-93: 165-172. DOI:10.1016/j.envint.2016.03.040
[20] Sickles Ⅱ J E, Suggs J C, Vorburger L M. Ozone indicators determined at rural sites in the eastern united states by two monitoring networks[J]. Environmental Monitoring and Assessment, 2000, 65(3): 485-502. DOI:10.1023/A:1006397731870
[21] 魏石梅, 潘竟虎, 妥文亮. 2015年中国PM2.5浓度遥感估算与时空分布特征[J]. 遥感技术与应用, 2020, 35(4): 845-854.
Wei S M, Pan J H, Tuo W L. Estimation and spatial-temporal distribution characteristics of PM2.5 concentration by remote sensing in China in 2015[J]. Remote Sensing Technology and Application, 2020, 35(4): 845-854.
[22] Sun Q, Wang W, Chen C, et al. Acute effect of multiple ozone metrics on mortality by season in 34 Chinese counties in 2013-2015[J]. Journal of Internal Medicine, 2018, 283(5): 481-488. DOI:10.1111/joim.12724
[23] 李一蜚. 基于梯度提升回归树的中国近地面O3浓度遥感估算[D]. 徐州: 中国矿业大学, 2020.
Li Y F. Remote sensing-based estimating ground-level O3 concentrations in china using gradient boosting regressor tree[D]. Xuzhou: China University of Mining and Technology, 2020.
[24] Li R, Cui L L, Fu H B, et al. Satellite-based estimation of full-coverage ozone (O3) concentration and health effect assessment across Hainan Island[J]. Journal of Cleaner Production, 2020, 244. DOI:10.1016/j.jclepro.2019.118773
[25] GB 3095-2012, 环境空气质量标准[S].
[26] HJ 633-2012, 环境空气质量指数(AQI)技术规定(试行)[S].
[27] 李旭文, 张悦, 姜晟, 等. "哨兵-5P"卫星TROPOMI传感器在江苏省域大气污染监测中的初步应用[J]. 环境监控与预警, 2019, 11(2): 10-16.
Li X W, Zhang Y, Jiang S, et al. Preliminary application of atmospheric pollution monitoring in Jiangsu province with TROPOMI sensor onboard Sentinel-5P satellite[J]. Environmental Monitoring and Forewarning, 2019, 11(2): 10-16. DOI:10.3969/j.issn.1674-6732.2019.02.002
[28] Huang G Y, Sun K. Non-negligible impacts of clean air regulations on the reduction of tropospheric NO2over East China during the COVID-19 pandemic observed by OMI and TROPOMI[J]. Science of the Total Environment, 2020, 745. DOI:10.1016/J.SCITOTENV.2020.141023
[29] Tilstra L G, de Graaf M, Wang P, et al. In-orbit Earth reflectance validation of TROPOMI on board the Sentinel-5 Precursor satellite[J]. Atmospheric Measurement Techniques, 2020, 13(8): 4479-4497. DOI:10.5194/amt-13-4479-2020
[30] 夏丛紫, 刘诚, 蔡兆男, 等. 哨兵5号欧洲业务二氧化硫产品在中国的准确性评估[J]. 科学通报, 2020, 65(20): 2106-2111.
Xia C Z, Liu C, Cai Z N, et al. Evaluation of the accuracy of the Sentinel-5 Precursor operational SO2 products over China[J]. Chinese Science Bulletin, 2020, 65(20): 2106-2111.
[31] 黄小刚, 邵天杰, 赵景波, 等. 气象因素和前体物对中国东部O3浓度分布的影响[J]. 中国环境科学, 2019, 39(6): 2273-2282.
Huang X G, Shao T J, Zhao J B, et al. Impact of meteorological factors and precursors on spatial distribution of ozone concentration in Eastern China[J]. China Environmental Science, 2019, 39(6): 2273-2282. DOI:10.3969/j.issn.1000-6923.2019.06.005
[32] 周学思, 廖志恒, 王萌, 等. 2013—2016年珠海地区臭氧浓度特征及其与气象因素的关系[J]. 环境科学学报, 2019, 39(1): 143-153.
Zhou X S, Liao Z H, Wang M, et al. Characteristics of ozone concentration and its relationship with meteorological factors in Zhuhai during 2013—2016[J]. Acta Scientiae Circumstantiae, 2019, 39(1): 143-153.
[33] 岳文泽, 徐建华, 徐丽华. 基于地统计方法的气候要素空间插值研究[J]. 高原气象, 2005, 24(6): 974-980.
Yue W Z, Xu J H, Xu L H. A study on spatial interpolation methods for climate variables based on geostatistics[J]. Plateau Meteorology, 2005, 24(6): 974-980. DOI:10.3321/j.issn:1000-0534.2005.06.018
[34] Zhan Y, Luo Y Z, Deng X F, et al. Satellite-Based estimates of daily NO2 exposure in China using hybrid random forest and spatiotemporal kriging model[J]. Environmental Science & Technology, 2018, 52(7): 4180-4189.
[35] 薛文博, 王金南, 杨金田, 等. 国内外空气质量模型研究进展[J]. 环境与可持续发展, 2013, 38(3): 14-20.
Xue W B, Wang J N, Yang J T, et al. Domestic and foreign research progress of air quality model[J]. Environment and Sustainable Development, 2013, 38(3): 14-20. DOI:10.3969/j.issn.1673-288X.2013.03.004
[36] 王占山, 李晓倩, 王宗爽, 等. 空气质量模型CMAQ的国内外研究现状[J]. 环境科学与技术, 2013, 36(S1): 386-391.
Wang Z S, Li X Q, Wang Z S, et al. Application status of models-3/CMAQ in environmental management[J]. Environmental Science & Technology, 2013, 36(S1): 386-391.
[37] Chen T Q, Guestrin C. XGBoost: A scalable tree boosting system[A]. In: Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco, USA: ACM, 2016. 785-794.
[38] Qin K, Rao L L, Xu J, et al. Estimating ground level NO2 concentrations over central-Eastern China using a satellite-based geographically and temporally weighted regression model[J]. Remote Sensing, 2017, 9(9). DOI:10.3390/rs9090950
[39] Zou B, Luo Y Q, Wan N, et al. Performance comparison of LUR and OK in PM2.5 concentration mapping: a multidimensional perspective[J]. Scientific Reports, 2015, 5. DOI:10.1038/srep08698
[40] 吴健生, 谢舞丹, 李嘉诚. 土地利用回归模型在大气污染时空分异研究中的应用[J]. 环境科学, 2016, 37(2): 413-419.
Wu J S, Xie W D, Li J C. Application of land-use regression models in spatial-temporal differentiation of air pollution[J]. Environmental Science, 2016, 37(2): 413-419.
[41] Zhan Y, Luo Y Z, Deng X F, et al. Spatiotemporal prediction of daily ambient ozone levels across China using random forest for human exposure assessment[J]. Environmental Pollution, 2018, 233: 464-473. DOI:10.1016/j.envpol.2017.10.029
[42] 高素莲, 闫学军, 刘光辉, 等. 济南市夏季臭氧重污染时段VOCs污染特征及来源解析[J]. 生态环境学报, 2020, 29(9): 1839-1846.
Gao S L, Yan X J, Liu G H, et al. Characteristics and source apportionment of ambient VOCs in serious ozone pollution period of summer in Ji'nan[J]. Ecology and Environmental Sciences, 2020, 29(9): 1839-1846.
[43] 李一蜚, 秦凯, 李丁, 等. 基于梯度提升回归树算法的地面臭氧浓度估算[J]. 中国环境科学, 2020, 40(3): 997-1007.
Li Y F, Qin K, Li D, et al. Estimation of ground-level ozone concentration based on GBRT[J]. China Environmental Science, 2020, 40(3): 997-1007. DOI:10.3969/j.issn.1000-6923.2020.03.008
[44] 苏筱倩, 安俊琳, 张玉欣. 基于支持向量机回归和小波变换的O3预报方法[J]. 中国环境科学, 2019, 39(9): 3719-3726.
Su X Q, An J L, Zhang Y X. Support vector machine regression forecasting of O3 concentrations based on wavelet transformation[J]. China Environmental Science, 2019, 39(9): 3719-3726. DOI:10.3969/j.issn.1000-6923.2019.09.015
[45] Yli-Pelkonen V, Scott A A, Viippola V, et al. Trees in urban parks and forests reduce O3, but not NO2 concentrations in Baltimore, MD, USA[J]. Atmospheric Environment, 2017, 167: 73-80. DOI:10.1016/j.atmosenv.2017.08.020