环境科学  2019, Vol. 40 Issue (4): 1697-1704   PDF    
支持向量机回归在臭氧预报中的应用
苏筱倩1, 安俊琳1, 张玉欣2, 梁静舒3, 刘静达1, 王鑫1     
1. 南京信息工程大学气象灾害教育部重点实验室, 气候与环境变化国际合作联合实验室, 气象灾害预报预警与评估协同创新中心, 南京 210044;
2. 青海省人工影响天气办公室, 西宁 810001;
3. 中国气象局气象探测中心, 北京 100081
摘要: 采用南京工业区2016年5月20日~8月15日这一高臭氧(O3)期的O3、O3前体物和常规气象资料数据,利用支持向量机回归(SVMr)方法分别预报O3的小时值、日最大值和最大8 h滑动平均值.结果表明,O3小时值预报的相关系数(R2)为0.84,平均绝对误差(MAE)和平均绝对百分误差(MAPE)分别为3.44×10-9和24.48,O3前期浓度、紫外B波段辐射(UVB)和NO2浓度是关键因子.O3日最大值预报的主要因子是NOx在07:00的浓度和UVB.预报O3 8 h时UVB和气温起重要作用.加入前体物项能够使O3的预报精度提升10%~28%.与多元线性回归方法相比,SVMr对O3浓度的预报有明显优势.
关键词: 支持向量机回归      臭氧预报      臭氧小时值      臭氧日最大值      臭氧日最大8h滑动平均     
Application of Support Vector Machine Regression in Ozone Forecasting
SU Xiao-qian1 , AN Jun-lin1 , ZHANG Yu-xin2 , LIANG Jing-shu3 , LIU Jing-da1 , WANG Xin1     
1. Key Laboratory of Meteorological Disaster, Ministry of Education, Joint International Research Laboratory of Climate and Environment Change, Collaborative Innovation Center on Forecast and Evaluation of Meteorological Disasters, Nanjing University of Information Science and Technology, Nanjing 210044, China;
2. Weather Modification Office of Qinghai Province, Xining 810001, China;
3. Meteorological Observation Centre of China Meteorological Administration, Beijing 100081, China
Abstract: Support vector machine regression (SVMr) was proposed to forecast hourly ozone (O3) concentrations, daily maximum O3 concentrations, and maximum 8 h moving average O3 concentrations (O3 8 h) by employing the observations of meteorological variables and O3 and its precursors during the high O3 periods from May 20 to August 15, 2016 at an industrial area in Nanjing. The squared correlation coefficient (R2) of the hourly O3 concentrations forecast was 0.84. The mean absolute error (MAE) and mean absolute percentage error (MAPE) were 3.44×10-9 and 24.48, respectively. The key factors for the hourly O3 forecast were the O3 pre-concentrations, amount of ultraviolet radiation B (UVB), and the NO2 concentration. The main factors for the O3 daily maximum forecast were the NOx concentrations at 07:00 and the UVB level. Temperature and UVB played an important role in predicting O3 8 h. In general, taking precursors into account could increase the accuracy of O3 prediction by 10%-28%. For O3 concentration forecasting, SVMr gave significantly better predictions than multiple linear regression methods.
Key words: support vector machine regression (SVMr)      O3 prediction      hourly O3 concentrations      daily maximum O3 concentrations      maximum 8 h moving average O3 concentrations     

近年来, 随着中国工业化、城镇化进程的加快和汽车保有量的增加, 光化学烟雾、雾-霾等复合型大气污染问题正严重影响着生态环境和公共健康[1~3].研究大气污染物的预报方法, 建立有效的大气污染物预警机制, 对改善城市空气质量, 政府制定控制策略有重大的应用价值.空气污染预报方法主要分为数值预报和统计预报.主流的数值预报模型有三维欧拉型模式(comprehensive air quality model with extensions, CAMx)、社区多尺度空气质量模式(community multiscale air quality, CMAQ)、化学天气数值模式(weather research and forecasting model coupled to chemistry, WRF-chem)、MM5-chem大气化学模式(fifth-generation Penn state/NCAR mesoscale model coupled to chemistry, MM5-chem)和嵌套网格空气质量预报模式(nested air quality prediction modeling system, NAQPMS)等, 数值预报方法能够模拟污染物的转化、迁移和扩散, 反映污染物的变化规律, 但是其建立在获取大量的气象数据、污染物排放源数据和空气监测数据的基础上, 需要掌握污染变化的机制, 计算耗时长.统计预报方法如回归模型[4~6]具有计算简单、资料要求较低和准确度高的优势, 在业务预报中应用广泛, 但其大多以线性回归理论为基础, 难以应用到非线性系统.近年来, 随着计算机技术的发展, 神经网络[7~9]、决策树[10, 11]和支持向量机(support vector machine, SVM)等基于统计理论的机器学习方法, 在解决非线性问题时表现出优异的性能.

SVM遵循结构风险最小化原则, 善于解决小样本、非线性和高维模式识别问题[12].与遵循经验风险最小化原则的人工神经网络等传统机器学习方法不同, SVM避免了过拟合、局部最优或局部优化能力差、调参困难和收敛慢等问题[13, 14].近年来, 支持向量机回归(support vector machine regression, SVMr)不仅用于预报太阳辐射[15]、云量[16, 17]和能见度[18, 19], 还广泛应用于预报O3等大气污染物浓度.有研究者将SVMr对污染物的预报结果与线性回归模型[20]、多层感知机(MLP)[21]、向量自回归模型(VARMA)和自回归积分滑动平均模型(ARIMA)[22]进行比较, 发现SVMr预报效果更优. Yeganeh等[23]考虑了SVMr中4种核函数的差异, 发现径向基核函数(RBF)最适合.有研究者将SVM与小波分解[24]、相空间重构理论[25]、遗传算法优化的BP神经网络(GA-BPNN)[26]等相结合来预报污染物, 发现结合预报的精度大于仅使用SVM或人工神经网络. Xu等[27]基于SVM开发了太原、哈尔滨和重庆这3个城市的空气质量预警系统, 经实验比较, 此系统的准确性和有效性均高于其现有的空气质量预警结果, 具有应用价值.

之前的学者多致力于SVMr与其他预报方法的比较, 对O3的预报较少, 预报O3的时次单一且多考虑气象因素.本研究在考虑气象因素的基础上, 还加入了NO、NO2、氮氧化物(nitrogen oxides, NOx)、挥发性有机物(volatile organic compounds, VOCs)和一氧化碳(carbon monoxide, CO)这3种前体物, 同时预报了O3的小时平均值、日最大值和最大8 h滑动平均这3种O3监测、预报常用的国家空气质量标准中指标, 以期为O3公众预警预报业务提供一种新的思路和方法.

1 材料与方法 1.1 观测站点

本研究观测站点位于江苏省南京市浦口区南京信息工程大学气象楼楼顶(32°12′N, 118°42′E, 海拔高度62 m).站点东边500 m处为主干道宁六路、高架快速路和地铁S8号线; 站点东北5 km处为包括石油化工、钢铁厂、化工厂和热电厂等在内的工业区; 其西南900 m处为南京龙王山风景区.常规气象资料数据来源于距观测站点约1.5 km的中国气象局综合观测实习基地.站点具体位置见图 1.

图 1 观测点的位置和附近环境 Fig. 1 Location of the observation site and its surroundings

1.2 仪器及监测方法

O3、NO、NO2、NOx和CO的观测均采用美国赛默飞世尔科技公司生产的大气污染环境监测分析仪, 包括49i紫外发光O3分析仪、42i化学发光NO-NO2-NOx分析仪和48i红外吸收CO分析仪.详细仪器参数及校准方法可参见文献[28].

大气中VOCs观测采用由德国AMA公司生产的GC5000自动在线气相色谱氢火焰离子监测系统(gas chromatography-flame ionization detector, GC-FID)进行连续监测.详细仪器参数及校准方法可参见文献[29].

1.3 支持向量机回归(SVMr)模型

SVM是Vapnik于1995年首先提出的机器学习方法, 此方法建立在统计学习中VC维理论和结构风险最小原理的基础上, 其主要思想是将低维空间中的x用非线性函数φ映射到一个高维特征空间φ(x), 在高维空间中寻求线性回归超平面从而解决低维空间中的非线性问题.高维特征空间中的线性函数可以构造为:

(1)

式中, y为输出, 〈wφ(x)〉表示特征空间的内积, 权重向量w和偏置常数b可以通过最小化风险函数[式(2)]得到.

(2)

其中:

(3)

式中, C是预先设定的惩罚系数, 惩罚大于ε的误差. ε是训练集和实际观测值之间的偏差.引入松弛变量ξi, 和ξi*则式(2)的求解可以转变为式(4):

(4)

约束条件:

(5)

引入拉格朗日乘子αiαi*, 建立拉格朗日函数进而求解原问题的对偶问题.最终得到最优超平面的回归函数, 如式(6):

(6)

式中, K(xi, x)成为核函数, 其表达式如下:

(7)

本研究使用LIBSVM3.22软件包(http://www.csie.ntu.edu.tw/~cjlin/libsvm/), 选择的是对非线性系统拟合好且在大气污染物浓度预报中应用最多的RBF核函数, 其表达式为:

其中σ为可调参数.建模时将数据分为训练集和预报集, 采用k折交叉验证(k=3)和MATLAB编程自动寻找使均方误差(mean square error, MSE)最小的参数cg, 再将其应用到预报集得出结果.

1.4 实验数据

本研究选取2016年5月20日~8月15日这一O3高值时段进行预报, 缺失的数据都被剔除, 期间有效的小时平均数据为1 436组, 日平均数据为71组, 样本数达到了SVMr建模所需的特征量[22, 26, 30].为提高模型的泛化能力, 选取各月约70%的数据作为训练集, 剩余时段的数据作为预报集, 所用的数据通过MATLAB中的mapminmax函数归一化到(0, 1)以消除不同数据间量纲的影响. O3及其前体物的单位均为体积分数(×10-9), 观测的56种VOCs分为烷烃、芳香烃、烯烃和炔烃这4类进行讨论, 具体划分可参见文献[31].为方便表达, 文中模式输入方案的变量名称均用缩写表示(见表 1).

表 1 变量缩写及其含义 Table 1 Abbreviations of the variables and their descriptions

1.5 评价标准

为比较SVMr预报结果与观测值之间的差别, 采用以下统计参量对模型进行评价和选择.

均方误差(mean square error, MSE):

(8)

决定系数(squared correlation coefficient, R2):

(9)

平均绝对差值(mean absolute error, MAE):

(10)

平均绝对百分误差(mean absolute percentage error, MAPE):

(11)

式中, Oi表示在i时的观测值, Pi表示在i时的预报值, n表示样本总数目, SSres表示残差平方和, SStot表示总离差平方和, Om表示观测值的平均数.

2 结果与讨论 2.1 O3小时值预报

首先, 对气温、风速、风向、相对湿度和太阳辐射等常规气象变量的小时平均值与O3小时平均值做相关性分析, 将相关系数绝对值大于0.40(均通过显著性水平α=0.05的显著性检验)的气象变量作为模型的输入.由此得到的气象输入变量为气温、相对湿度、紫外B波段辐射(ultraviolet radiation B, UVB)和日照时数, 相关系数分别为0.47、-0.74、0.50和0.53.预报时刻前期的O3浓度能够提高模型预报的准确性[32], 经模型测试, 选取预报时刻前1 h的O3浓度作为输入变量.由于模型预报时间不超过15 s, 将上述气象变量拟作为最优组合全部代入模型, 每次只去除一项输入因子, 以检验各变量在模型中的表现.结果显示(表 2), 去除UVB项后, 模型的MAE和MAPE均增加8%, 去除日照时数项, MAE和MAPE分别增加了2%和12%, 其它因素的变化相对不明显.这说明在气象因素中, 太阳辐射作为大气中光化学反应的主要能源, 对O3小时值的预报尤为重要.

表 2 气象变量对SVMr预报精度的影响 Table 2 Effect of the meteorological variables on the prediction accuracy of SVMr

由于O3与其前体物有着非线性, 强耦合的关系, 这里在气象变量确定的基础上, 直接将各前体物分别代入模型进行筛选, 确定拟最优方案.结果如表 3所示.可以发现前体物中, 加入NO2后模型的MAE和MAPE减小最多, 均达到10%, 其次为CO, 其MAE和MAPE分别减少9%和6%.宁六路等交通干道和附近的综合工业区是NO2和CO重要的人为源地, 日出后, NO2等前体物经过复杂的光化学反应生成O3.另外, 4种VOCs中, 芳香烃的表现最优, 其次为烯烃.张玉欣等[33]利用箱模式计算了南京工业区夏季VOCs的相对增量反应性, 发现烯烃和芳香烃是控制O3浓度最有效的两类物种, 这与模型的预报结果相吻合.根据模型结果, 将NO2、CO和芳香烃的小时平均值加入拟最优方案.

表 3 前体物对SVMr预报精度的影响 Table 3 Effect of the precursors on the prediction accuracy of SVMr

O3小时值的预报结果如图 2所示, 小时预报值与观测值的趋势吻合得很好, 两者相关系数达到0.84, 模型对峰值、谷值都有较为准确的捕捉, MAE、MAPE分别为3.44×10-9和24.48. 表 4展示了对拟最优方案进行敏感性分析后的预报结果.可以看出, 无论去除哪一项变量, 预报的准确度都有不同程度地降低, 这说明选取的变量对模型预报都有优化作用.综合来看, 在气象因子中, UVB和气温的作用最明显, 从模型中去除它们后, MAE分别增加了12%和3%, MAPE分别增加11%和16%.在前体物中, NO2的作用最显著.对比表 2表 4可以发现, 在气象变量的基础上加入前体物后, 模型的MAE和MAPE分别降低了10%和12%, R2由0.81提高到0.84, 这说明考虑前体物为预报因子能够有效提高SVMr预报O3小时浓度的精度.

图 2 O3小时浓度的观测值和预报值对比 Fig. 2 Observed vs. predicted hourly O3 concentration

表 4 O3小时浓度的预报结果 Table 4 Forecast results for the hourly O3 concentration

多元线性回归方法作为经典统计预报方法之一, 在当今业务预报中仍常使用, 本研究利用SPSS软件, 输入与SVMr最优方案相同的预报因子, 构建多元线性回归方程, 结果如表 4所示, SVMr各项统计量均优于多元线性回归方法, 在南京工业区夏季O3小时浓度的预报中显示出优势.

用O3前2 h浓度替代前1 h浓度代入模型, 其R2也能达到0.75, 如图 3(a)预报值和观测值的趋势基本一致, 但峰值有较大差异, MAE和MAPE分别增加到4.43×10-9和31.21.若将O3前24 h浓度代入模型, R2降低到0.45.这说明在O3小时值预报里, O3的前期浓度是影响最大的因素, 前体物各变量与其相比作用不明显.

图 3 O3不同前期浓度对SVMr预报的影响 Fig. 3 Effect of different pre-concentrations of O3 on the prediction using SVMr

2.2 O3日最大值预报

按照前文所述, 通过统计相关性分析, 选取日最高气温、日平均相对湿度、日累积降水量和日累积UVB作为输入的气象变量, 其相关系数分别为0.50、-0.61、-0.46和0.60.在模型测试中, 相对湿度的优化作用不明显, 为避免信息冗余并保证模型的可解释性, 将其去除.

图 4描述了各前体物的日变化.由于夜间的积累及早高峰车辆的排放, 各前体物在早上呈现上升的趋势, 随着日出后边界层高度抬升, 太阳辐射加强近地面的湍流混合作用, 同时光化学反应也开始进行, 各前体物浓度在早上07:00~08:00达到最大值后逐渐下降.由此, 选取NO、NO2和NOx在07:00的浓度、VOCs和CO在08:00的浓度作为输入变量, 它们分别代表了各前体物在光化学反应前的初始浓度.同时, 选取各前体物浓度的日平均值代入模型, 它们在一定程度上代表了前体物在一天中的平均状况.

图 4 O3及前体物的日变化曲线 Fig. 4 Diurnal variations in O3 and its precursors

在气象变量的基础上分别输入各前体物项, 经比较, 最终选取NOx在07:00的浓度值、烯烃的日平均值作为输入变量, MAE和MAPE分别降低了28%和23%, 说明前体物项显著提升了O3日最大值的预报精度.在测试时发现, 虽然NO、NO2和NOx在07:00的浓度值都可以使模型得到优化, 但若将三者同时放入模型, 其预报效果反而会降低, 这可能是由于NO、NO2、NOx之间存在相关关系, 在没有O3前期浓度参与预报时, 这种相关关系产生的影响更加凸显.因此, 在NO、NO2和NOx中, 只挑选更主要的因子, 即NOx在07:00的浓度值.另外, 从加入VOCs的预报效果来看, 其日平均值要略优于08:00的值.这可能是因为O3日最大值一般出现于下午14:00~16:00, 而VOCs的化学反应速率很快, 其早上08:00的高浓度不足以影响到O3下午的最大值.与O3小时浓度预报相似, 4种VOCs中烯烃的表现最优, 邵平等[34]采用丙烯等量体积分数比较夏季南京北郊VOCs的反应活性, 也发现烯烃所占的比例最高.

将选取的上述变量代入模型, 结果显示, O3日最大值的预报值和观测值间的MAE和MAPE分别为5.48×10-9和17.26, 模型预报结果比较理想. 表 5给出了不同输入变量对模型预报效果的影响.可以看出各输入变量的影响差异不大, NOx在07:00的浓度最重要, 去除它后, MAE和MAPE分别提高了28%和20%, 其次是UVB, 说明早高峰时期排放的NOx通过光化学反应容易积累生成高浓度的O3.

表 5 O3日最大浓度的预报结果 Table 5 Forecast results of the daily maximum O3 concentration

图 5(a)可以直观地看到, SVMr对15 d模拟的差异不大, 但高估了7月6日的O3日最大浓度, 低估了5月25日和7月7日的浓度, 这几日在不同时段都有不同程度地降水, 反映出模型对晴天或无降水日的模拟效果优于降水日, 将天气分类研究可能会提高模型预报O3浓度的日最大值的准确性.用相同因子建立多元线性回归方程, 其MAE和MAPE较SVMr的结果分别提高了40%和45%, SVMr表现出明显的优势.

图 5 O3日最大浓度和最大8 h滑动平均的观测值与预报值对比 Fig. 5 Observed vs. predicted daily maximum O3 concentration and maximum 8 h moving average O3 concentration

2.3 O3最大8 h滑动平均预报

经统计, 本文研究时期中O3最大8 h滑动平均(O3 8 h)出现最多的时段是12:00~19:00, 占总天数的30%, 其次为13:00~20:00和11:00~18:00, 分别占总天数的20%和18%.这表明O3 8 h污染常出现在白天晴热高温、太阳直射紫外线较强的时段.

与前文的方法相同, 选取出日平均相对湿度、日累积降水量、日累积UVB、日平均气温和CO的日平均浓度作为输入变量.在气象因子的基础上加入前体物项后, 模型的MAE和MAPE降低了25%和22%.预报结果如图 5(b)所示, SVMr模拟效果很好, 但依然存在降水日的预报偏差较大的现象.

表 6可以看到, 去除日均气温后, 模型的准确度最低, MAE和MAPE分别增加了47%和63%, 其次为UVB的日累积值和相对湿度.在预报O3 8 h时, 气象要素的重要性大于前体物, 特别是气温、UVB这类直接影响白天光化学反应的因子.相对湿度可以表征大气中的水汽含量, 在近地面O3的化学过程中, 水汽含量的增加有利于反应O(1D)+H2O2OH的进行从而间接促进O3的增加, 另一方面, 过高的水汽含量会直接对O3产生湿清除.另外, 水汽对O3前体物之间光化学反应的非线性作用也会间接影响O3的生成.在前体物中, VOCs、NO、NO2和NOx相对于CO更加活泼, 在预报O3 8 h这种较长时间段的平均浓度时难有优势.

表 6 O3最大8 h滑动平均的预报结果 Table 6 Forecast results of the maximum 8 h moving average O3 concentration

3 结论

(1) SVMr对南京工业区夏季的O3浓度有准确预报.预报O3小时值时的R2达到0.84, MAE和MAPE分别为3.44×10-9和24.48. O3前期浓度是提高小时值预报精度的关键因子, 其次为UVB和NO2.预报O3日最大值的主要因素是NOx在早高峰的浓度和UVB, 而日均气温和UVB等热力学因子在预报O3 8 h时更加重要. O3 8 h和日最大值的预报结果均表现出“晴天优于降水日”的特征, 在研究时将天气分型可能降低预报误差.

(2) 相较于仅考虑气象因素, 方案中加入前体物项后SVMr预报的准确性有了10%~28%的提升, 前体物项有效地优化了模型. 4种VOCs中, 烯烃和芳香烃等对南京工业区O3生成贡献大的高活性物种在O3浓度预报中值得关注.

(3) 与多元线性回归方法相比, SVMr的MAE和MAPE分别提高了14%~78%和9%~76%, SVMr在预报O3浓度时具有明显优势.

参考文献
[1] Karlsson P E, Klingberg J, Engardt M, et al. Past, present and future concentrations of ground-level ozone and potential impacts on ecosystems and human health in northern Europe[J]. Science of the Total Environment, 2017, 576: 22-35. DOI:10.1016/j.scitotenv.2016.10.061
[2] Wang T, Xue L K, Brimblecombe P, et al. Ozone pollution in China:a review of concentrations, meteorological influences, chemical precursors, and effects[J]. Science of the Total Environment, 2016, 575: 1582-1596.
[3] Yang C X, Yang H B, Guo S, et al. Alternative ozone metrics and daily mortality in Suzhou:the China air pollution and health effects study (CAPES)[J]. Science of the Total Environment, 2012, 426: 83-89. DOI:10.1016/j.scitotenv.2012.03.036
[4] Zhai L, Li S, Zou B, et al. An improved geographically weighted regression model for PM2.5 concentration estimation in large areas[J]. Atmospheric Environment, 2018, 181: 145-154. DOI:10.1016/j.atmosenv.2018.03.017
[5] 安俊琳, 王跃思, 朱彬. 主成分和回归分析方法在大气臭氧预报的应用——以北京夏季为例[J]. 环境科学学报, 2010, 30(6): 1286-1294.
An J L, Wang Y S, Zhu B. Principal component and multiple regression analysis predicting ozone concentrations:case study in summer in Beijing[J]. Acta Scientiae Circumstantiae, 2010, 30(6): 1286-1294.
[6] Barrero M A, Grimalt J O, Cantón L. Prediction of daily ozone concentration maxima in the urban atmosphere[J]. Chemometrics and Intelligent Laboratory Systems, 2006, 80(1): 67-76. DOI:10.1016/j.chemolab.2005.07.003
[7] Gao M, Yin L T, Ning J C. Artificial neural network model for ozone concentration estimation and Monte Carlo analysis[J]. Atmospheric Environment, 2018, 184: 129-139. DOI:10.1016/j.atmosenv.2018.03.027
[8] Mao X, Shen T, Feng X. Prediction of hourly ground-level PM2.5 concentrations 3 days in advance using neural networks with satellite data in eastern China[J]. Atmospheric Pollution Research, 2017, 8(6): 1005-1015. DOI:10.1016/j.apr.2017.04.002
[9] Gómez-Sanchis J, Martín-Guerrero J D, Soria-Olivas E, et al. Neural networks for analysing the relevance of input variables in the prediction of tropospheric ozone concentration[J]. Atmospheric Environment, 2006, 40(32): 6173-6180. DOI:10.1016/j.atmosenv.2006.04.067
[10] 丁愫, 陈报章, 王瑾, 等. 基于决策树的统计预报模型在臭氧浓度时空分布预测中的应用研究[J]. 环境科学学报, 2018, 38(8): 3229-3242.
Ding S, Chen B Z, Wang J, et al. An applied research of decision-tree based statistical model in forecasting the spatial-temporal distribution of O3[J]. Acta Scientiae Circumstantiae, 2018, 38(8): 3229-3242.
[11] 靳小兵, 徐会明, 卜俊伟, 等. 决策树方法在一次历史异常雷电活动中的预报能力检验[J]. 高原山地气象研究, 2013, 33(4): 56-60, 78.
Jin X B, Xu H M, Pu J W, et al. The forecast ability test of decision tree method in an abnormal lightning activity[J]. Plateau and Mountain Meteorology Research, 2013, 33(4): 56-60, 78.
[12] Vapnik V N. The nature of statistical learning theory[M]. New York: Springer, 2000: 17-34.
[13] García Nieto P J, Combarro E F, del Coz Díaz J J, et al. A SVM-based regression model to study the air quality at local scale in Oviedo urban area (Northern Spain):a case study[J]. Applied Mathematics and Computation, 2013, 219(17): 8923-8937. DOI:10.1016/j.amc.2013.03.018
[14] Lu W Z, Wang W J. Potential assessment of the "support vector machine" method in forecasting ambient air pollutant trends[J]. Chemosphere, 2005, 59(5): 693-701. DOI:10.1016/j.chemosphere.2004.10.032
[15] Quej V H, Almorox J, Arnaldo J A, et al. ANFIS, SVM and ANN soft-computing techniques to estimate daily global solar radiation in a warm sub-humid environment[J]. Journal of Atmospheric and Solar-Terrestrial Physics, 2017, 155: 62-70. DOI:10.1016/j.jastp.2017.02.002
[16] 赵文婧, 赵中军, 汪结华, 等. 基于支持向量机的云量精细化预报研究[J]. 干旱气象, 2016, 34(3): 568-574, 589.
Zhao W J, Zhao Z J, Wang J H, et al. A study on refined forecast of cloud cover based on support vector machine[J]. Journal of Arid Meteorology, 2016, 34(3): 568-574, 589.
[17] 熊秋芬, 顾永刚, 王丽. 支持向量机分类方法在天空云量预报中的应用[J]. 气象, 2007, 33(5): 20-26.
Xiong Q F, Gu Y G, Wang L. Application of SVM method to cloud amount forecast[J]. Meteorological Monthly, 2007, 33(5): 20-26.
[18] 吴波, 胡邦辉, 王学忠, 等. 基于近似支持向量机的能见度释用预报研究[J]. 热带气象学报, 2017, 33(1): 104-110.
Wu B, Hu B H, Wang X Z, et al. Visibility forecast based on proximal support vector machine[J]. Journal of Tropical Meteorology, 2017, 33(1): 104-110.
[19] 郑朝霞, 周梅, 季致建, 等. SVM方法在霾识别和能见度预报中的应用[J]. 气象科技进展, 2016, 6(6): 30-34.
Zheng Z X, Zhou M, Ji Z J, et al. Application of SVM method to identification of haze and prediction of visibility[J]. Advances in Meteorological Science and Technology, 2016, 6(6): 30-34.
[20] Canu S, Rakotomamonjy A. Ozone peak and pollution forecasting using support vectors[R]. Yokohama: IFAC, 2001.
[21] García Nieto P J, García-Gonzalo E, Sánchez A B, et al. Air quality modeling using the PSO-SVM-based approach, MLP neural network, and M5 model tree in the metropolitan area of Oviedo (Northern Spain)[J]. Environmental Modeling & Assessment, 2018, 23(3): 229-247.
[22] García Nieto P J, Sánchez Lasheras F, García-Gonzalo E, et al. PM10 concentration forecasting in the metropolitan area of Oviedo (Northern Spain) using models based on SVM, MLP, VARMA and ARIMA:a case study[J]. Science of the Total Environment, 2018, 621: 753-761. DOI:10.1016/j.scitotenv.2017.11.291
[23] Yeganeh B, Motlagh M S P, Rashidi Y, et al. Prediction of CO concentrations based on a hybrid partial least square and support vector machine model[J]. Atmospheric Environment, 2012, 55: 357-365. DOI:10.1016/j.atmosenv.2012.02.092
[24] 朱佳, 王振会, 金天力, 等. 基于小波分解和最小二乘支持向量机的大气臭氧含量时间序列预测[J]. 气候与环境研究, 2010, 15(3): 295-302.
Zhu J, Wang Z H, Jin T L, et al. Combination of wavelet decomposition and least square support vector machine to forcast atmospheric ozone content time series[J]. Climatic and Environmental Research, 2010, 15(3): 295-302. DOI:10.3878/j.issn.1006-9585.2010.03.09
[25] Niu M F, Gan K, Sun S L, et al. Application of decomposition-ensemble learning paradigm with phase space reconstruction for day-ahead PM2.5 concentration forecasting[J]. Journal of Environmental Management, 2017, 196: 110-118.
[26] Feng Y, Zhang W F, Sun D Z, et al. Ozone concentration forecast method based on genetic algorithm optimized back propagation neural networks and support vector machine data classification[J]. Atmospheric Environment, 2011, 45(11): 1979-1985. DOI:10.1016/j.atmosenv.2011.01.022
[27] Xu Y Z, Yang W D, Wang J Z. Air quality early-warning system for cities in China[J]. Atmospheric Environment, 2017, 148: 239-257. DOI:10.1016/j.atmosenv.2016.10.046
[28] 王俊秀, 安俊琳, 邵平, 等. 南京北郊大气臭氧周末效应特征分析[J]. 环境科学, 2017, 38(6): 2256-2263.
Wang J X, An J L, Shao P, et al. Characteristic study on the "weekend effect" of atmospheric O3 in northern Suburb of Nanjing[J]. Environmental Science, 2017, 38(6): 2256-2263.
[29] An J L, Zhu B, Wang H L, et al. Characteristics and source apportionment of VOCs measured in an industrial area of Nanjing, Yangtze River Delta, China[J]. Atmospheric Environment, 2014, 97: 206-214. DOI:10.1016/j.atmosenv.2014.08.021
[30] Luna A S, Paredes M L L, de Oliveira G C G, et al. Prediction of ozone concentration in tropospheric levels using artificial neural networks and support vector machine at Rio de Janeiro, Brazil[J]. Atmospheric Environment, 2014, 98: 98-104. DOI:10.1016/j.atmosenv.2014.08.060
[31] 安俊琳, 朱彬, 李用宇. 南京北郊大气VOCs体积分数变化特征[J]. 环境科学, 2013, 34(12): 4504-4512.
An J L, Zhu B, Li Y Y. Variation characteristics of ambient volatile organic compounds (VOCs) in Nanjing northern suburb, China[J]. Environmental Science, 2013, 34(12): 4504-4512.
[32] Chelani A B. Prediction of daily maximum ground ozone concentration using support vector machine[J]. Environmental Monitoring and Assessment, 2010, 162(1-4): 169-176. DOI:10.1007/s10661-009-0785-0
[33] 张玉欣, 安俊琳, 王俊秀, 等. 南京工业区挥发性有机物来源解析及其对臭氧贡献评估[J]. 环境科学, 2018, 39(2): 502-510.
Zhang Y X, An J L, Wang J X, et al. Source analysis of volatile organic compounds in the Nanjing industrial area and evaluation of their contribution to ozone[J]. Environmental Science, 2018, 39(2): 502-510.
[34] 邵平, 安俊琳, 杨辉, 等. 南京北郊夏季近地层臭氧及其前体物体积分数变化特征[J]. 环境科学, 2014, 35(11): 4031-4043.
Shao P, An J L, Yang H, et al. Variation characteristics of surface ozone and its precursors during summertime in Nanjing northern suburb[J]. Environmental Science, 2014, 35(11): 4031-4043.