Prediction of PAHs Content in Soil Around Gas Stations in Beijing Based on BP Neural Network
随着经济社会快速发展, 机动车逐渐走进人们的日常生活, 同时也带来了巨大的能源需求.从20世纪50年代开始, 世界各国陆续开始建设汽车加油站, 这使得全球的加油站数目猛增[1].根据欧美的经验, 大约30%的使用寿命超过20 a的加油站会出现漏油事故[2].加油站的地下储油罐和输油管线发生泄漏后, 不仅会污染附近土壤, 土壤中的石油污染还可在土壤淋溶和渗滤等作用下, 造成范围更广的土壤污染[3].
石油中含有大量有毒有害的有机物[4], PAHs是其中一种主要成分, 因其具有遗传毒性和“三致效应”而受到广泛关注[5].土壤作为一种重要的环境介质, 由于自身疏松多孔的结构, 成为PAHs在自然环境中的贮存库和中转站[6, 7].关于环境负荷的数据显示, 土壤中容纳的PAHs可以达到90%以上, 大部分的PAHs是经过土壤进入人体的, 远远高于通过大气和水体等其它途径进入的[8, 9]. PAHs进入人体的方式主要包括3种类型:呼吸吸入、皮肤接触暴露和食物摄入, 长时间PAHs暴露会对人体健康造成一定程度的损害, 甚至存在较高的致癌风险[10].
北京作为我国首都, 2020年常住人口达到2 189万人, 居民的机动车保有量持续增长, 加油站数量也随之上升.据统计[11], 截至2021年底, 北京市市机动车保有量达600.3万辆, 加油站数量为1 187座.
加油站作为典型的“点源”, 在石油产品运输、罐装和加油等过程中均伴随PAHs等污染物挥发, 对周边包括土壤在内的环境介质造成污染, 进而可能对周边居民和加油站工作人员等产生潜在的健康风险[12~14].因此, 准确评估加油站周边土壤PAHs含量水平并对其未来发展趋势进行科学预测显得尤为重要[15].目前关于土壤环境中污染来源的分析和风险评价已有研究[16, 17], 而利用社会经济因素、加油站特征因素和加油站土壤中PAHs污染水平相关性进行系统性地研究来预测加油站土壤PAHs的研究鲜见报道.当前, 以BP神经网络为代表的机器学习方法在环境科学研究领域得到了广泛应用, 并在大数据处理和污染物模拟预测方面显示出独特的优势[18, 19].
本研究的主要目标:①基于BP神经网络模型确定社会经济因素、加油站特征因素与加油站土壤PAHs的相关性; ②使用一种合理的预测方法, 预测北京市加油站土壤PAHs含量; ③评价BP神经网络预测效果, 以期为改善城市土壤环境质量提供参考.
1 材料与方法
1.1 研究区域概况
北京市位于华北平原西北部, 北纬39°54′, 东经116°23′, 市区总面积约2 267 km2, 常住人口2 189万[20].北京市属于典型的温带半湿润季风气候, 春、秋季节短, 夏季漫长炎热, 冬季则十分寒冷; 同时其降雨季节分配不均匀, 多在夏季[21]. 2021年工业总产值20 879.3亿元, 其中重工业产值17 933.8亿元, 石油及煤炭工业产值455.9亿元.本研究区域位于北京市六环路内, 包括东城区、西城区、昌平区、朝阳区、海淀区、石景山区、丰台区、房山区、大兴区、顺义区和通州区.
1.2 样品采集和化学分析
采集研究区内117个加油站及其周边(20 m)表层土壤样品.采集土壤样品前, 先铲除地表草根和落叶, 采集表层土壤样品500 g左右.土壤样品在25℃条件下风干, 去除石块等杂物后研磨过120目(< 0.125 mm)筛, 放入棕色玻璃瓶低温(4℃)避光保存[22].采用美国EPA 3550C、3630C和8270E进行土壤样品PAHs提取、纯化和分析检测[23].
1.3 指标选取
为对加油站周边土壤PAHs含量进行科学预测, 本研究收集了2012~2020年在北京市城市化进程中影响土壤中PAHs累积的9个社会经济因素和5个加油站特征因素.社会经济因素包括GDP(X1)、常住人口(X2)、常住人口密度(X3)、能源消费(X4)、煤炭消费(X5)、天然气消费(X6)、液化石油气消费(X7)、汽油消费(X8)和汽车拥有量(X9), 见表 1.加油站特征因素包括: ①加油站存续时间, 即加油站建站时间; ②距市中心距离, 以天安门为市中心, 求取天安门与各采样点的直线距离; ③加油站所处的环位置, 其地理位置以北京市制定的环形公路为参考; ④道路长度, 根据地图, 确定加油站所在路段的长度; ⑤道路分级, 将道路分为4个等级, 并将其与加油站最近的主要道路等级确定为其道路等级.其中, 道路等级划分为:①一级或二级公路; ②高速公路; ③轨道; ④小径或人行道.
表 1
(Table 1)
表 1 2020年北京市各行政区社会经济指标数据[20]
Table 1 Socio-economic indicators of Beijing City in 2020
行政区 |
X1×108/元 |
X2×104/人 |
X3/人·km-2 |
X4(以标煤计)×104/t |
X5/kg |
X6/m3 |
X7/kg |
X8/L |
X9/辆 |
东城 |
2 954.7 |
70.9 |
16 937 |
300.9 |
21.0 |
30 917.0 |
10 167.0 |
336 113.0 |
559 148 |
西城 |
5 065.1 |
110.6 |
21 888 |
363.0 |
0 |
53 763.0 |
140.5 |
1 197.2 |
483 235 |
朝阳 |
7 037.9 |
345.1 |
7 583 |
856.0 |
596 370.8 |
478 276.9 |
17 078.6 |
4 116.6 |
1 053 991 |
海淀 |
8 504.6 |
313.2 |
7 271 |
701.3 |
60 800 |
155 000.0 |
3 400.0 |
104 100.0 |
956 689 |
丰台 |
1 854.2 |
201.9 |
6 602 |
444.0 |
511.1 |
155 794.0 |
25.8 |
1 739.5 |
564 665 |
石景山 |
855.5 |
56.8 |
6 736 |
121.6 |
22.7 |
13 833.0 |
457.0 |
5 567.0 |
155 128 |
房山 |
759.9 |
131.3 |
660 |
825.4 |
209 992.4 |
37 187.5 |
99 212.4 |
2 609.7 |
278 643 |
通州 |
1 102.9 |
184.0 |
2 030 |
311.1 |
247 857.0 |
18 313.0 |
24 817.0 |
9 116.0 |
374 605 |
顺义 |
1 773.3 |
132.4 |
1 298 |
995.2 |
16.79 |
43 031.0 |
30 649.3 |
8 134.9 |
296 409 |
昌平 |
1 147.5 |
226.9 |
1 689 |
344.0 |
170 606.0 |
71 047.4 |
6 268.3 |
24 707.3 |
427 346 |
大兴 |
932.8 |
199.4 |
1 924 |
305.1 |
221 100 |
12 384.0 |
190.0 |
3 586.0 |
384 971 |
|
表 1 2020年北京市各行政区社会经济指标数据[20]
Table 1 Socio-economic indicators of Beijing City in 2020
|
1.4 BP神经网络的构建
要对加油站土壤PAHs含量进行预测, 首先要构建BP神经网络模型.依次排列117份样品, 从每3份样品中随机抽取1份作为检验样本, 剩余部分为训练样品, 共计39份检验样品, 78份训练样品.BP神经网络是一种由输入层、隐含层和输出层组成的运算模型(图 1).本研究选择14个因子作为BP神经网络的输入, 输出因子为北京市加油站土壤PAHs含量, 也就是14个输入层节点和1个输出层节点.每个节点都是一种特定的输出函数, 称为激活函数[24]; 权重是指每两个节点间的连接所代表的对于通过该连接信号的加权值, 每个层次的权值都可以被学习调节[25].每个周期的权重变化根据学习率0.05确定.输出层采用纯线性函数(purlin), 在训练函数中引入梯度下降训练函数(trained), 设置了25 000个重复的学习迭代数, 并通过反复计算得到权重系数和阈值, 直至学习训练过程结束, 最后建立模型.在此基础上, 通过模型进行网络训练, 比较验证预测值与样本实测值, 并通过决定系数(R2)来验证模型的拟合程度.
1.5 毒性当量
苯并[a]芘(BaP)用来评估PAHs的致癌能力, 同时单体PAHs的致癌能力由BaP的毒性等效因子(TEF)表征[26, 27].PAHs的毒性当量(TEQ)的数值通过PAHs含量和其对应的TEF值相乘得到[28].且TEQ与土壤PAHs的含量存在一定的相关性:
式中, Ci为土壤中PAHs的组分i含量; TEFi为对应组分i的毒性当量因子, 其取值采用Nisbet等[29]确定的TEFs数值, BaP的TEF值是1, 在全部PAHs中最高.
1.6 数据分析
采用SPSS 24.0对数据进行统计分析, 采用ArcGIS 10.8软件绘制加油站土壤PAHs含量的空间分布图, 采用Matlab软件构建BP神经网络模型, 图片和表格采用CorelDRAW X7和Origin 2021软件处理.
2 结果与讨论
2.1 PAHs含量及其空间分布
北京市加油站土壤PAHs含量及其空间分布如图 2所示.从中可知, 北京市加油站土壤中PAHs变化较大, 范围为0.01~4.07 mg·kg-1, 平均值为0.039mg·kg-1, 中位数为0.029 mg·kg-1.各单体PAH的含量均低于《土壤环境质量建设用地土壤污染风险管控标准(试行)》(GB 36600-2018)筛选值.
从空间分布特征可以看出, PAHs含量最高的采样点分别位于海淀区、丰台区和朝阳区.北京城区总体上由内城向外发展, 随着距市中心距离的增加呈现出城市化速度递减的趋势[30].20世纪70年代, 北京市区缓慢扩张, 局限在三环内.内城虽然历史最悠久, 但也是北京最早限制煤炭使用的地区, 并且在该地区采取了更多的环保措施, 这在很大程度上导致了市中心的PAHs含量较低[23].中国石化北安河加油站(红色方块)位于海淀区西六环附近, 其附近有各种采摘园和国家电网(苏家坨西区), 我国早期使用煤炭等发电时会产生大量有机污染物, 可能是该加油站PAHs含量高的原因之一[31].多环芳烃高度集中的另一个原因是海淀区有10多所大学, 其中主要是大学冬季供暖和人为活动的影响[22].丰台区位于北京市主城区南部, 紧邻内城.有研究表明, 北京老城区高分子量多环芳烃的高比例可能是这些地区城市化时间长的结果[23], 这使得多环芳烃在土壤中长期积累.因此, 这可能是导致丰台区加油站PAHs含量较高的原因之一.此外, 该地区距离中心城区较远, 其土壤中的PAHs可能受到城市尺度大气沉降过程中PAHs输入的影响, 在此期间低环PAHs从污染较严重的内陆地区迁移到外部区域[32~34].位于朝阳区的北京焦化公司, 曾经是中国最大的炼焦企业, 也是最大的商品焦炭的供应和出口基地, 每年焦炭产量可达200多万t, 是全国总生产量的1.67%[35].由于北京市长时间进行工业生产, 尤其是在石化厂、焦化厂和炼钢厂的煤干馏和煤炭燃烧过程中, 会产生大量的PAHs和携带有POPs的粉尘被释放到大气中, 经过大气沉降等方式沉积在周边区域的土壤中, 造成其附近土壤的污染[36].
此外, 加油站储油罐及管道的泄漏, 加油站中汽油和柴油的逸散以及汽车加油过程中, 汽油等的挥发会导致附近土壤中PAHs的积累[37].同时, 上述加油站(图 2中红色方块)均位于北京市主干道附近, 此处汽车流量大, 会对道路产生较大的交通负荷[38, 39].有研究表明, 在城市的公共交通及道路沿线附近, 汽车尾气是土壤中PAHs的主要来源之一[40, 41], 因此推测这些地区土壤PAHs含量增加的原因是汽车尾气的大量排放.同时这些加油站位于北京市住宅区附近, 居民日常生活和冬天取暖所产生的PAHs及其他污染物会通过其他大气沉降等方式进入土壤, 使土壤中PAHs的含量升高[42].有研究表明, 城区土壤中PAHs含量与城市人口数量及活动强度呈正相关[43].综上所述, 北京市加油站土壤PAHs含量总体处于较低水平, 但也有部分高含量点位分散在各个城区, 这可能与燃煤、汽车尾气排放和加油站汽油柴油等挥发泄漏有关.
为进一步明确土壤中PAHs对人体健康的影响, 利用毒性当量因子(TEFs)对加油站内PAHs的毒性当量(TEQ)进行了分析(图 3).结果表明, 117个加油站土壤中PAHs的TEQ均低于WHO标准值(1 mg·kg-1), 加油站土壤中PAHs的TEQ范围为0.005 0~0.62mg·kg-1, 平均值为0.063 mg·kg-1.因此, 北京市加油站土壤中PAHs对人体健康的影响较小.
2.2 BP神经网络模型建立
BP神经网络模型构建是通过选择全部1 638个训练样本来完成的, 拟合检验的结果如图 4所示.结果表明, 模型训练次数为10 000次时, 其训练会达到最佳效果, 同时在训练样本MSE为4.3×10-5时, 训练收敛效果最好[44]; 同时, 模型的拟合值(R2)为0.922, 最大拟合误差为20%, R2接近于1, 且预测值曲线和实测值曲线也几乎重合, 表明PAHs样本神经网络训练样本的相关性较好, 与采用回归模型方法进行定量分析相比, BP神经网络的预测准确率更高[45].因此, 使用BP神经网络模型能够较好地预测北京市加油站土壤中PAHs含量.
2.3 基于BP神经网络中的影响因素对土壤中PAHs水平的预测
以社会经济的发展趋势作为先决条件, 5 a时间作为等差值, 通过对9个社会经济因素数据的合理使用, 建立基于BP神经网络的9个线性和多项式回归模型[46], 可得到2025年和2030年研究区域的各社会经济因素的数据随着时间的变化趋势, 如表 2所示.
表 2
(Table 2)
表 2 北京市社会经济因素的BP神经网络拟合程度(R2)
Table 2 Fitting degree of BP neural network of social and economic factors in Beijing
行政区 |
X1
|
X2
|
X3
|
X4
|
X5
|
X6
|
X7
|
X8
|
X9
|
东城 |
0.910 |
0.918 |
0.913 |
0.910 |
0.907 |
0.921 |
0.921 |
0.911 |
0.915 |
西城 |
0.921 |
0.911 |
0.911 |
0.913 |
0.911 |
0.911 |
0.918 |
0.914 |
0.918 |
朝阳 |
0.920 |
0.918 |
0.930 |
0.919 |
0.937 |
0.928 |
0.926 |
0.913 |
0.913 |
海淀 |
0.938 |
0.918 |
0.933 |
0.905 |
0.912 |
0.919 |
0.917 |
0.912 |
0.913 |
丰台 |
0.918 |
0.909 |
0.916 |
0.909 |
0.927 |
0.901 |
0.927 |
0.933 |
0.903 |
石景山 |
0.907 |
0.918 |
0.927 |
0.902 |
0.911 |
0.926 |
0.911 |
0.923 |
0.906 |
房山 |
0.927 |
0.904 |
0.927 |
0.909 |
0.922 |
0.905 |
0.927 |
0.901 |
0.901 |
通州 |
0.930 |
0.934 |
0.941 |
0.912 |
0.927 |
0.913 |
0.931 |
0.938 |
0.917 |
顺义 |
0.941 |
0.931 |
0.937 |
0.911 |
0.931 |
0.931 |
0.918 |
0.935 |
0.913 |
昌平 |
0.913 |
0.933 |
0.918 |
0.925 |
0.918 |
0.937 |
0.938 |
0.916 |
0.923 |
大兴 |
0.918 |
0.932 |
0.927 |
0.917 |
0.924 |
0.918 |
0.941 |
0.915 |
0.921 |
|
表 2 北京市社会经济因素的BP神经网络拟合程度(R2)
Table 2 Fitting degree of BP neural network of social and economic factors in Beijing
|
对各影响因素的预测结果表明, 截至到2030年, 通州区、昌平区、顺义区和大兴区在各区域的回归趋势上均存在一定的差异, 而其它区的回归趋势则基本一致.随着时间的推移, 各研究区的GDP、天然气和能源消费等指标都有明显的上升趋势; 通州区、昌平区、顺义区和大兴区的常住人口和人口密度都将继续增加, 但其余7个区的人口和密度却有明显的下降趋势.海淀区和房山区的煤耗也有逐年增加的趋势, 其它区的煤消耗量有下降的趋势.除东城区和西城区外, 其他地区的机动车数量和消费量也呈现出逐年上升的态势.通州区、海淀区和顺义区的液化石油气(LPG)消费量逐年增加, 其它区则呈现出下降的趋势.
由此可见, 对于2025年和2030年北京社会经济因素的数据预测符合社会的发展趋势[47].对北京市加油站特征因素, 随着时间的推移, 计算出加油站的存续时间[48].因此, 本研究所采用的14个影响因素可以用于预测北京市加油站土壤PAHs含量.
将2025年和2030年研究区域的社会经济因素和加油站特征因素用于构建BP神经网络模型, 预测北京市加油站土壤PAHs含量, 预测结果如图 5所示.
2025年北京市加油站土壤中ω(PAHs)范围为0.085~4.077mg·kg-1, 平均值为0.050mg·kg-1, 中位数为0.063mg·kg-1; 2030年北京市加油站土壤ω(PAHs)范围为0.132~4.412mg·kg-1, 平均值为0.056mg·kg-1, 中位数为0.076mg·kg-1(图 5).结果显示, 2025年北京市加油站土壤中PAHs含量平均值相差较小, 但中位数大于2020年的, 表明2025年北京市加油站土壤PAHs含量总体呈上升趋势, 需引起重视.
2025年所有采样点PAHs含量变幅均较小, 所有行政区PAHs含量呈上升趋势, 朝阳区、海淀区和丰台区的加油站土壤中PAHs含量远远高于其他行政区, 而其它行政区(昌平区、东城区、西城区、大兴区、石景山区、房山区、通州区和顺义区)ω(PAHs)不超过2.0 mg·kg-1, 且单体PAH含量水平低于(GB 36600-2018)的土壤污染风险筛选值(图 5).2025~2030年间, 北京市加油站土壤PAHs含量持续升高, 但其单体PAH含量水平仍低于(GB 36600-2018)土壤污染风险筛选值.综上, 目前北京市加油站土壤PAHs含量处于安全水平, 但呈上升趋势, 且部分城区土壤PAHs含量偏高且增长较快, 需要引起重视, 并采取切实有效的措施加以控制.
3 结论
(1) 当前, 北京市加油站土壤PAHs含量处于较低水平, 个别点位加油站土壤PAHs含量较高, 需要重点关注.加油站土壤中PAHs的TEQ低于WHO设定的标准值平均值, 其对人体健康的毒性风险较小.
(2) 北京市加油站土壤PAHs含量呈现持续增长的趋势, 其中朝阳区、丰台区和海淀区增速较快, 需要引起重视.预计至2030年, 北京市加油站土壤PAHs含量平均值低于土壤污染风险筛选值(GB 36600-2018), 对人体健康的影响较小.
(3) BP神经网络模型可以较好地模拟预测加油站土壤PAHs含量发展趋势, 为土壤环境管理提供科学依据.