环境科学  2023, Vol. 44 Issue (6): 3488-3499   PDF    
PMF和RF模型联用的土壤重金属污染来源解析与污染评价:以西北某典型工业园区为例
高越1, 吕童1, 张蕴凯1, 张博晗1, 毕思琪1, 周旭1, 张炜1, 曹红斌1, 韩增玉2     
1. 北京师范大学地理科学学部, 北京 100875;
2. 宁夏回族自治区生态环境监测中心, 银川 750004
摘要: 基于西北某典型工业园区工厂内的地表土壤中7种重金属元素[As、Cd、Cu、Pb、Hg、Ni和Cr(Ⅵ)]的含量, 分析该工业园区重金属污染特征, 并采用潜在生态风险指数和地累积指数法分别进行生态风险和污染评价; 利用正定矩阵因子分解(PMF)模型和随机森林(RF)模型进行定量源解析, 并结合采样企业排污资料和源排放成分谱经验数据识别特征元素, 判定排放源类别.结果表明, 园区所有采样点位的重金属均未超过建设用地土壤污染风险管控标准(GB 36600-2018)中第二类建设用地筛选值; 但相比当地土壤背景值, 除As和Cr以外的5种元素均有不同程度的富集, 整体呈轻微污染和中度生态风险(RI=250.04); 其中Cd和Hg是该园区的主要风险元素; 源解析结果得到5类主要污染源, 分别是化石燃料燃烧与化工生产源(33.73%和9.71%, 分别为PMF和RF所得源贡献率, 下同), 自然来源与废渣堆填(32.40%和40.80%)、交通排放(24.49%和48.08%)、燃煤与有色金属冶炼(5.43%和0.11%)以及电镀与矿石冶炼(3.95%和1.30%).两种模型的总体变量模拟效果R2均达到0.96以上, 可以较好地预测重金属含量.但结合园区内企业数量和道路密度的实际情况, 园区土壤重金属的主要污染来源应以工业来源为主, PMF模型模拟结果更贴近园区实际.
关键词: 重金属      源解析      正定矩阵因子分解(PMF)      随机森林(RF)      工业园区     
Source Apportionment and Pollution Assessment of Soil Heavy Metal Pollution Using PMF and RF Model: A Case Study of a Typical Industrial Park in Northwest China
GAO Yue1 , LÜ Tong1 , ZHANG Yun-kai1 , ZHANG Bo-han1 , BI Si-qi1 , ZHOU Xu1 , ZHANG Wei1 , CAO Hong-bin1 , HAN Zeng-yu2     
1. Faculty of Geographical Science, Beijing Normal University, Beijing 100875, China;
2. Ningxia Ecological and Environmental Monitoring Center, Yinchuan 750004, China
Abstract: Based on the concentration data of seven heavy metal elements [As, Cd, Cu, Pb, Hg, Ni, and Cr(Ⅵ)] in the surface soil of a typical industrial park in northwest China, the characteristics of heavy metal pollution in the industrial park were analyzed, and the ecological risk and pollution were evaluated using the potential ecological risk index and the index of geo-accumulation. The positive matrix factorization (PMF) model and random forest (RF) model were used for quantitative source analysis, and the emission data of sampling enterprises and empirical data of the source emission component spectrum were combined to identify the characteristic elements and determine the emission source category. The results showed that the heavy metals at all sampling points in the park did not exceed the second-class screening value of construction land in the soil pollution risk control standard for construction land (GB 36600-2018). However, compared with the local soil background values, five elements, excluding As and Cr, were enriched in different degrees, presenting slight pollution and moderate ecological risk (RI=250.04). Cd and Hg were the main risk elements of the park. The results of source analysis showed that the five main sources of pollution were fossil fuel combustion and chemical production sources (33.73%, 9.71%, total source contribution rate of PMF and RF, respectively; the same below), natural sources and waste residue landfill (32.40%, 40.80%), traffic emissions (24.49%, 48.08%), coal burning and non-ferrous metal smelting (5.43%, 0.11%), and electroplating and ore smelting (3.95%, 1.30%). The simulation R2 of the total variable of the two models were above 0.96, indicating that the models could predict heavy metals well. However, considering the actual situation of the number of enterprises in the park and roading density, the main pollution sources of soil heavy metals in the park should be industrial sources, and the simulation results of the PMF model were closer to the actual situation in the park.
Key words: heavy metals      source apportionment      positive matrix factorization (PMF)      random forest(RF)      industrial park     

重金属是一类毒性较强、对人体健康和生态环境危害较大的物质[1], 土壤重金属污染具有累积性、不可逆性及难以有效去除等特点[2], 可以通过食物链富集, 亦可通过扬尘吸入、皮肤接触等不同途径进入人体, 对生态环境和居民身体健康产生严重威胁[3, 4].我国西北地区工业园区的兴建带动了当地经济快速增长, 但高污染和高耗能企业也带来了严重的环境问题, 特别是以重金属污染为首的土壤环境污染问题亟待解决[5~7].然而大多数针对工业园区的研究只停留在污染特征和风险评价上, 鲜见有针对土壤重金属来源的定量解析和系统的评价.对于土壤重金属污染, 最有效的解决方式就是确定重金属污染的来源并对源头加以控制.

目前, 以污染区域为研究对象的受体模型是土壤重金属污染源解析的主流方法, 如主成分分析(PCA)[8~10]、绝对主成分得分/多元线性回归(APCS/MLR)[11, 12]、正定矩阵因子分解法(positive matrix factorization, PMF)[13~16]、UNMIX模型[17, 18]等.其中PMF作为美国环保署(US EPA)官方推荐的定量源解析受体模型[19], 因其无需输入复杂源谱、操作简单、结果可靠等特点而应用广泛.同时随着机器学习技术的发展, 随机森林模型(random forest, RF)、地理加权回归(GWR)模型和贝叶斯最大熵(BME)等机器学习方法已逐渐应用于土壤污染源的分析[20~23].特别是RF模型克服了传统机器学习在数据分析方面的严格要求, 训练过程调参简便, 可以对输入数据特征变量的重要程度进行定量和排序, 尤其适用于环境中污染物的定量来源分析[24, 25].然而, 目前大多数研究还是采用RF分析污染物浓度的主要影响要素, 辅助进行源识别.刘斌等[26]应用多元统计分析初步得到指征晋中盆地土壤重金属自然和人为来源的3个因子, 采用RF模型探究污染企业距离、道路距离、土壤有机质含量等9个要素对土壤各重金属元素影响的重要度, 结合各因子的元素组成判别具体的自然及人为来源; Huang等[23]在湖北襄州的研究采用相关分析及PCA确定土壤重金属的同源性, 进一步结合RF细化了耕地土壤重金属的主要人为源是工业污染、交通排放和农家肥施用; 仅有个别研究[27]将RF模型应用于PM2.5的定量源解析, 基于PCA因子得分计算其相对重要性作为源贡献率; 尚未见将RF模型与PMF定量源解析方法相结合, 分别计算各污染来源的贡献率, 比较源成分组成的异同并相互佐证的研究.

本文选取西北地区某典型工业园区为研究对象, 采集了园区内11个代表性企业的113个表层土壤样本; 分析了7种土壤重金属浓度的空间分布特征; 采用地累积指数及潜在生态风险指数评价了园区土壤重金属的污染程度和生态风险; 最后, 采用PMF-RF模型联用的方法定量解析土壤重金属来源, 结合园区实际对两种分析结果加以验证, 以期为西北地区有关部门加强工业园区的土壤污染治理提供依据.

1 材料与方法 1.1 样品采集与分析

所研究的工业园区位于我国西北地区, 是以煤化工、合金制造和精细化工为主的大型综合性产业开发区.园区规划面积约为86.6 km2, 现有企业近300家.参考国家标准《土壤质量土壤采样技术指南》(GB/T 36197-2018)[28], 于2020年8月13日至9月17日在11个代表性企业厂区内部使用五点采样法采集0~20 cm表层土壤样本; 并使用手持GPS仪器在中心点位确定采样点坐标.共采集表层土壤样本113个.采样点位置如图 1.将采集好的样品在室内阴凉处自然风干, 研磨后过100目筛(0.149 mm孔径), < 4℃避光保存备用.

图 1 采样点和工厂分布示意 Fig. 1 Distribution of sampling sites and plants

本研究共测定土壤中As、Cd、Cu、Pb、Hg、Ni和Cr(Ⅵ)这7种重金属元素含量, 前处理方法、检测仪器和方法检出限如表 1所示.

表 1 重金属元素测定方法、检测仪器、方法检出限及标准物质实测值/mg·kg-1 Table 1 Determination methods, instruments, method detection limit and measured values of certified reference materials for heavy metals/mg·kg-1

分析过程采用标准土壤GSS-33(GBW 07389, 中国地质科学院地球物理地球化学勘查研究所)对As、Cd、Cu、Pb、Hg和Ni进行质控, 使用土壤中六价铬成分分析标准物质GBW(E)070252(核工业240研究所)对Cr(Ⅵ)进行质控, 各重金属测定值均在标称值范围内(表 1), 实验室内平行样相对标准偏差(RSD) < 5%.

1.2 数据处理与空间分析

借助Excel和SPSS(IBM SPSS Statistics 23)对实验数据进行统计分析, 使用ArcGIS(10.4.1版本)将含有经纬度的地表重金属点位数据的空间分布可视化, 插值方法为反距离权重插值(inverse distance weighted, IDW); 其余统计图表使用Origin 2021和CorelDRAW X7制图处理.

1.3 污染及风险评价 1.3.1 地累积指数

地累积指数又被称为Muller指数, 是用于研究沉积物及其它介质中重金属污染程度的定量指标[34].公式如下:

式中, Igeo为地累积指数, Cn为单一元素含量, 单位mg·kg-1, Bn为对应元素的土壤背景值, 单位mg·kg-1, k为校正系数, 一般取1.5, 用于修正背景值波动.由于土壤背景值中无Cr(Ⅵ)的统计值, 按总Cr的1/7将样品中Cr(Ⅵ)测定值转化为总Cr代入后续计算[35].

地累积指数的污染等级为: 无污染(≤0)、轻微(0~1)、轻度(1~2)、中度(2~3)、偏重(3~4)、重度(4~5)和极重(≥5).

1.3.2 潜在生态风险指数

潜在生态危害指数法是由瑞典科学家Hakanson[36]从沉积学角度提出的生态风险评估方法, 现已广泛应用于土壤等多介质的评估[5, 23, 37].其计算公式如下:

式中, Ei为单个元素的潜在生态风险指数, RI为多元素的综合潜在生态风险指数, Ti为元素i的毒性响应系数, 本研究采用的毒性系数分别为:As=10, Cd=30, Cu=Pb=Ni=5, Hg=40, Cr=2; Ci为单个元素实测含量, Cbi为该元素的参考值, 本研究取宁夏省级土壤背景值[38], 单位均为mg·kg-1.潜在生态风险指数的Cr(Ⅵ)也按1/7的比例转化.

由于本研究的重金属与Hakanson划分RI生态风险级别时采用的污染物类别有部分不同, 因此根据重金属种类及其毒性系数将各生态风险等级对应RI限值区间进行适当调整[39, 40], 调整后的评价标准为: 轻微(Ei≤40, RI≤110)、中等(40 < Ei≤80, 110 < RI≤220)、强(80 < Ei≤160, 220 < RI≤440)、很强(160 < Ei≤320)、极强(Ei>320, RI>440).

1.4 源解析

使用受体模型与机器学习相结合的方法, 综合PMF和RF模型的结果对该工业园区内土壤重金属来源进行定量源解析; 结合实地走访调查获得的工厂分布、企业排污资料、重金属污染的空间分布和以往研究中各行业的特征污染物, 根据各源的特征元素确定排放源类别, 并定量确定其源贡献率.

1.4.1 PMF模型

正定矩阵因子分解(PMF)的工作原理是:基于加权最小二乘法进行迭代计算, 对分解矩阵做非负约束, 利用数据标准偏差来优化因子分析[19].

PMF将原始矩阵(Xn×m)分解为3个矩阵, 即:因子得分矩阵(Gn×p)、因子载荷矩阵(Fp×m)和残差矩阵(En×m).PMF模型不断分解受体矩阵X, 以得到最优的因子得分和载荷矩阵GF, 最优的判定标准是目标函数Q有最小值.

目标函数Q计算公式为:

式中, xi, j为第i个样品中第j个元素的含量, gi, k为因子k对第i个样品的相对贡献率, fk, j为因子k中第j个元素的含量, ei, j为残差, ui, j为第i个样品中第j个元素含量的不确定性大小.

PMF模型需要输入两组数据, 一组为样本元素的含量数据, 另一组为与含量数据对应的不确定性(Unc)数据.计算不确定性的公式如下:

式中, Unc为监测项目相对不确定度, MDL为方法检出限(mg·kg-1), C为监测项目含量(mg·kg-1), τ为误差分数(error fraction), 可以由化学分析中回收率来确定, 一般取经验值0.1[41~43].

结果检验采用DISP与BootStrap检验, 当输出结果中QRobust与数据库中的数据量QTheory相近时, 证明分析中的污染源数目选择合适, 分析结果可靠[19].目前EPA公布的最新版本为EPA PMF 5.0, 使用该模型对113份地表土壤中7种金属元素测定数据进行分析, 得到该区域土壤中重金属的来源及贡献率.

1.4.2 RF模型

随机森林模型(RF)是Breiman[44]提出的以决策树为基学习器的集成学习算法.它的基本原理是, 利用Bootstrap重抽样从原始样本中有放回地抽取多组样本, 每组样本分别构建决策树, 并取代原始样本进行训练, 所有决策树的平均得分作为最终结果, 基于均方误差来表征变量特征重要性(feature importance)这一排序属性.

研究人员通常会将降维处理后的因子得分矩阵输入RF模型进行后续分析[23, 26, 27].本文将PMF得到的因子得分矩阵作为RF模型的输入变量, 土壤重金属总量作为RF模型的预测变量, 通过特征重要性来判断输入变量对拟合结果的影响; 此外, 特征重要性还可用于表征各因子对各重金属元素含量的贡献率[27, 45]. 本研究中将PMF分解得到的因子得分矩阵作为输入变量, 分别预测7种重金属含量和土壤重金属总量, 并计算各因子(源)对不同元素的特征重要性以表征源贡献率.RF模型的搭建和调参均通过R v 4.0.6[46]的mlr3程序包及其拓展包进行.

除输入数据外, RF模型还需要确定3个重要参数:Ntree、Mtry和Nodesize.Ntree决定了模型包含的决策树数目, 参数过小会导致模型拟合不足, 参数过大则会导致模型过拟合, 调参范围为200、300、400、500和600.Mtry用于指定节点中用于二叉树的变量个数, 调参范围为1、2、3、4和5.Nodesize决定决策树终端节点的最小大小, 调参范围为2、4、6、8和10.对每个模型, 本研究重复50次参数的随机组合进行十折交叉检验(10-fold cross validation), 选取RMSE最小的参数组合为最优参数组合.

模型的验证除了使用与PMF一致的指标, 即决定系数(coefficient of determination, R2), 还选用平均绝对误差(mean absolute error, MAE)、均方根误差(root mean square error, RMSE)来评估模拟结果的合理性.各自公式如下:

式中, Xresi为第i个预测值, Xobsi为第i个观测值, n为输入样本量.

2 结果与讨论 2.1 土壤重金属分布特征

对113份工厂内表层土壤样品的7种重金属元素含量进行化学分析, 其描述性统计结果如表 2所示.背景值为文献[38]中宁夏省级土壤几何平均值, 筛选值为《土壤环境质量建设用地土壤污染风险管控标准》(GB 3600-2018)[47]中第二类建设用地筛选值.

表 2 表层土壤重金属含量1)(n=113) Table 2 Statistics of heavy metal concentrations in soil (n=113)

整体来看, 该工业园区7种重金属元素的含量平均值和最大值均未超标, 且远小于第二类用地筛选值.以当地背景值为基准, 计算元素的富集倍数, 并使用反距离权重插值表征各点位的富集程度(图 2).相比背景值, 除As和Cr以外的5种元素均有不同程度的富集, 其中Cd和Hg的含量均值为背景值的3.11倍和2.99倍, 呈现明显富集; Cu、Pb和Ni富集倍数分别为1.11、1.59和1.37, 呈轻微富集; As的整体富集倍数为背景值的0.85倍, 仅有个别点位轻微富集; Cr则全部未超过背景值, 平均仅为背景值的0.16倍.

图 2 重金属富集程度空间分布 Fig. 2 Spatial distribution of enrichment of heavy metals

从空间分布来看, 不同元素的富集区域差异较大, 但普遍在工厂附近富集.As仅在制药厂和化工厂附近有轻微富集; Cd和Hg在园区中西部均有富集, 此外Hg还在东北部有明显富集; Pb在园区中西部至东南部一带含量均偏高; Cu和Ni的高值点则相对分散且富集程度相对较低; Cr整体未超背景值, 相对高值区域与Ni的高值点分布较为类似.

2.2 土壤重金属污染及风险评价

园区的地累积指数统计值见表 3.Cd、Hg和Pb的平均值归属的污染等级为轻微污染, 其他元素的地累积指数小于0, 即可认为基本无污染.而除了Cr以外, 其他6种元素的地累积指数最大值均达到轻微污染, 说明这些元素在部分区域仍受到人为因素干扰; 其中Cd为轻度污染, Hg(0.97)和Pb(1.00)接近轻度污染, 说明Cd、Hg和Pb在研究区内部分区域存在富集.

表 3 重金属地累积指数 Table 3 Index of geo-accumulation of heavy metals

该园区的潜在生态风险指数评价的描述性统计结果如表 4所示, 各元素单因素潜在生态风险指数(Ei)均值由高到低依次为:Hg>Cd≫As>Pb>Ni>Cu>Cr.Hg和Cd的Ei值远大于其余5种元素, 属于强生态风险; 其余5种元素为轻微生态风险.Hg和Cd的高值也导致研究区的综合潜在生态风险指数(RI)达250.04, 等级达到强风险.而113个点位中, Hg和Cd的Ei最大值均可归类为极强风险, 且分别有98.23%和58.41%的点位生态风险为中度及以上, 说明Hg和Cd为该园区的主要生态风险元素.

表 4 重金属元素潜在生态风险指数统计与分布1) Table 4 Statistics and distribution of the potential ecological risk index of heavy metals

综合两类指数的污染评价结果, 可以发现Cd和Hg由于其毒性大、各点位含量高而成为该工业园区的主要污染元素.而对比两者的评价结果, 可以发现地累积指数反映的污染程度要普遍低于潜在生态风险指数反映的风险等级, 这是由于潜在生态风险指数综合考虑了各重金属的毒性和富集程度, 而地累积指数仅涉及相对于背景值的富集, 这也是Hg和Cd潜在生态风险指数为中度至极强风险, 而地累积指数结果仅为轻微污染的原因.

有学者在西北地区的研究也能证明Cd和Hg是当地工业园区土壤重金属污染的代表性元素.樊新刚等[5]在宁夏石嘴山河滨工业园区的研究表明, 园区Cd含量平均值是当地土壤背景值的36.91倍, 且所有样本均超标; 张松林[7]在宁夏石嘴山惠农区某工业园区的研究也发现, 土壤中Cd含量平均值超出国家二级标准值(pH>7.5)3.9倍, 具有较高的潜在生态风险; 罗成科等[6]的研究表明, 宁东基地工业园区的Cr、Cd、Pb和Hg含量平均值普遍高于土壤背景值, Hg更是明显偏高, 超出背景值7~8.5倍.

2.3 源解析 2.3.1 PMF模型

将113个点位土壤7种重金属含量数据输入PMF模型, 总体变量(total variable)为7种重金属总量.实际分析中, 将Cu和Cr(Ⅵ)设为weak, 即其不确定度数据变为原来的3倍参与后续计算; 并排除4条异常值数据.PMF的因子数(源个数)一般控制在3~7个[48], 需要综合考虑Q值大小、各元素及总体变量的决定系数R2以及园区的实际情况来确定最合理的分类解释.本研究最终确定因子个数为5个, 矩阵旋转度Fpeak=-0.1.模型通过了DISP和Bootstrap检验[19].模型输入元素的分类、决定系数R2和信噪比见表 5.模型预测的重金属总量的决定系数R2=0.963 3, 说明PMF模型整体拟合度良好, 结果可信.

表 5 PMF模型参数设置1) Table 5 Parameter settings for PMF model

PMF模型输出的各元素不同源的贡献率如图 3所示.

图 3 PMF和RF模型各重金属元素源贡献率 Fig. 3 Source contribution ratio of heavy metals in PMF and RF model

2.3.2 RF模型

将PMF模型分解得到的因子得分矩阵作为特征变量(自变量)输入RF模型, 各元素含量和总量含量作为预测变量(因变量), 分别对7种元素和总量各自建立单独的RF模型, 提取其特征重要性参数以获取各污染源贡献率, 结果如图 3所示.

综合PMF和RF模型的解析结果, 对5类来源进行判定.FAC1的特征污染物为Hg(59.1%、96.2%, 分别为PMF和RF模型所得各源对土壤中该元素的贡献率, 下同).参考前人研究, 煤炭燃烧和有色金属冶炼是我国土壤Hg污染的主要来源之一[49~52].煤炭燃烧仍然是园区内各工厂的主要动力来源; 并参考图 4中各排放源均一化贡献率的空间分布, 可知FAC1的主要贡献区域位于园区东北部冶金工厂附近, 同时在产企业污染源信息调查也显示Hg是该工厂废水中的特征污染物之一; 该主要贡献区域与图 2中Hg的高值区域也基本重合, 同时矿石冶炼厂附近Hg也存在相对高值.因此, FAC1被认为是煤炭燃烧和有色金属冶炼来源.

FAC2的主要构成元素为As(74.5%, 96.3%)和Cu(49.3%, 24.7%).As是典型的化石燃料燃烧源的标志元素[13, 53, 54], 同时它也是园区北部制药厂废水中含有的污染物之一(在产企业污染源信息调查); 有研究报告称Cu会在化工生产厂区附近富集[55], 同时Cu也是化肥中的重要污染成分[56, 57].从空间分布上来看, As和Cu在制药厂和化工厂附近区域存在富集(图 2), 其中化工厂5主要从事化肥生产, 且FAC2的源贡献率也在化工制药企业附近较高.故FAC2可被判断为化石燃料燃烧与化工生产的复合来源.

FAC3以Cd(72.0%, 99.5%)为主要特征元素.Cd是矿石冶炼精炼的标志元素[58~61], 也有文献表示Cd会在电镀钢及其它合金的防腐蚀工艺过程中产生[12].由图 4可知, FAC3的均一化贡献率在矿石冶炼厂和合金工厂附近有高值点, 元素Cd也在该区域富集, 因此FAC3可以归类为电镀与矿石冶炼源.

FAC4的特征元素是Ni(59.0%, 95.4%)和Cr(33.4%, 48.4%).Cr可能来源于自然风化作用[13, 62, 63], 且实测的整体含量远低于背景值; Ni是一种易受土壤母质和成土过程影响的元素[64], 也可能来自电镀冶金等工业排污[65].Ni含量平均值接近该地土壤背景值, 且污染等级总体为无污染; 但它的变异系数(表 2)较高, 在园区中部至南部均有富集, 表现出较强的空间分异性.经实地调查发现, 这些样点所在工厂均存在不同程度的废渣违规堆放, 这可能是Ni在部分区域偏高的原因.因此FAC4应识别为自然来源和废渣堆填.FAC4的源贡献率空间分布也印证了这一点.

FAC5的主要贡献元素为Pb(72.0%, 98.2%).Pb是机动车燃油和尾气排放的特征元素[8, 14, 53, 66], 从FAC5的源贡献空间分布可以看出(图 4), 该源的分布较为分散, 高值点零星分布在整个园区内, 在火车站等交通枢纽附近也有高值点.结合园区内道路分布(图 1), 可以将FAC5判断为交通排放源.

图 4 排放源均一化贡献率空间分布 Fig. 4 Spatial distribution of emission source contribution

综上所述, 源解析结果得到5类主要污染源, 分别是化石燃料燃烧与化工生产源(33.73%、9.71%, 分别为PMF, RF所得各源对土壤重金属的总贡献率, 下同)、自然来源与废渣堆填(32.40%, 40.80%)、交通排放(24.49%, 48.08%)、燃煤与有色金属冶炼(5.43%, 0.11%)以及电镀与矿石冶炼(3.95%, 1.30%).

2.3.3 模型结果评价

PMF模型更注重对总体变量的解释, 会忽略部分不确定度较高的元素(如Cu和Cr), 致使其拟合度降低.但PMF的优点在于, 各元素的源贡献率, 特别是总体变量的源贡献率更贴合园区实际, 如化石燃料燃烧与化工生产源(33.73%, 各源对土壤重金属的总贡献率, 下同)是园区内重要污染来源, 而机动车排放(24.49%)则相对较低.本研究采样点均位于各工厂内部, 包括6个化工厂、2个冶金合金厂以及活性炭生产厂、矿石冶炼厂和制药厂各1个, 化工企业的占比很高; 园区内道路密度相对较低(图 1), 且大部分为厂矿专用公路, 车流量很小; 从现场实际走访的情况来看, 这些工厂均存在不同程度的废渣违规堆放, 因此废渣堆填也是园区土壤重金属污染的重要来源之一.根据园区实际情况, 该园区的污染来源应以工业来源为主, 即化石燃料燃烧与化工生产源和自然来源与废渣堆填源的贡献率应高于交通排放源, 这也与其他工业园区的源解析结果相符[67, 68], PMF模型的结果更合理.RF模型得到的各源贡献率比例中, 交通排放源(48.08%)的占比偏高, 高于化石燃料燃烧与化工生产源(9.71%)和自然来源与废渣堆填源(40.80%), 与园区实际情况不符.

相对PMF模型的源解析结果, 可以看出RF模型的各源的最主要的特征元素种类没有发生变化, 但该最主要特征元素的源贡献率均有所上升, 例如在源贡献率中(图 3), As对FAC2的单源贡献率由PMF的74.5%上升至96.3%, Ni对FAC4的贡献率由59.0%提高至95.4%, 即污染源特征元素的“区分度”提高.RF模型对各元素的预测含量与实际含量之间的回归分析散点拟合如图 5所示.相对于PMF模型, RF模型在保持总变量R2(PMF和RF的R2分别为0.963 3和0.966 7)基本持平的情况下, 提高了Cu和Cr的R2, 模型解释率提高, 显示了较高的预测精度, 但各源的贡献率占比不太符合实际.

图 5 RF模型预测含量与实际含量散点拟合 Fig. 5 Scatter-fitting for actual monitoring value and predicted values in RF model

在输入相同的因子得分矩阵(即源谱)的情况下, RF模型与PMF模型解析出来的污染源类别是一致的, 具体表现在源的组成和特征元素相似; 但源贡献率存在差异, 原因是二者计算源贡献率的算法不同.PMF将各原始变量的因子载荷作为源贡献率, 表达提取的公因子对原始变量的影响程度; RF则是将输入的因子得分矩阵作为特征, 评估使用每个特征构建的决策树的性能, 将特征的相对重要性数值作为源贡献率[27].相较于PMF模型, RF模型在数据量更大的情况下能发挥更好的效果[23, 26, 27].

2.4 不确定性分析

由于土壤背景值缺少Cr(Ⅵ)的准确数据, 使用1/7这一经验值将测定值Cr(Ⅵ)转换为总Cr参与污染和风险评价后续计算, 这可能导致结果出现偏差.此外, 两个源解析模型各有优劣, PMF源贡献率特征更符合园区实际情况, 但个别元素的R2偏低, RF的各元素R2拟合度更好, 预测精度较高, 但源贡献率特征与实际稍有出入.作为机器学习方法的一种, RF模型需要大量数据做支撑, 因此增加训练模型所用的实际数据会提升模型效果, 未来可将其应用到更大区域范围内, 增加采样点位, 并增加其他环境变量作为协变量[23, 26], 以取得更好的预测效果.

3 结论

(1) 该工业园区土壤重金属的含量均远小于第二类建设用地土壤筛选值, 但元素的空间离散程度大, 并且除As和Cr之外的重金属含量均高于当地土壤背景值, 且Cd和Hg富集倍数较大, 表明受到了人为因素的干扰.从空间分布上来看, 不同元素的富集区域差异较大, 但普遍在工厂附近富集.

(2) Hg和Cd的潜在生态风险等级为强, 其余5种元素为轻微生态风险; 地累积指数Cd、Hg、Pb为轻微污染, 其他元素基本无污染.结合富集倍数综合来看, Cd和Hg是该工业园区的主要污染元素.

(3) 该园区土壤重金属的主要来源可分为5类, 分别是化石燃料燃烧与化工生产源(33.73%, 9.71%, 分别为PMF和RF所得各源对土壤重金属的总贡献率, 下同)、自然来源与废渣堆填(32.40%, 40.80%)、交通排放(24.49%, 48.08%)、燃煤与有色金属冶炼(5.43%, 0.11%)以及电镀与矿石冶炼(3.95%, 1.30%).

(4) PMF和RF模型总体变量的R2均达到0.96以上, RF的单元素R2更是都达到了0.7以上, 模型预测重金属含量的能力较高; 源贡献比例方面, 结合园区企业数量与道路密度情况, 其污染来源应以工业源为主, PMF模型的解释度更贴近园区实际情况.

参考文献
[1] Järup L. Hazards of heavy metal contamination[J]. British Medical Bulletin, 2003, 68: 167-182. DOI:10.1093/bmb/ldg032
[2] Carr R, Zhang C S, Moles N, et al. Identification and mapping of heavy metal pollution in soils of a sports ground in Galway City, Ireland, using a portable XRF analyser and GIS[J]. Environmental Geochemistry and Health, 2008, 30(1): 45-52. DOI:10.1007/s10653-007-9106-0
[3] 孙贤斌, 李玉成. 淮南大通煤矿废弃地土壤重金属空间分布及变异特征[J]. 地理科学, 2013, 33(10): 1238-1244.
Sun X B, Li Y C. The spatial distribution of soil heavy metals and variation characteristics of Datong abandoned coal mine Area in Huainan city[J]. Scientia Geographica Sinica, 2013, 33(10): 1238-1244.
[4] 王菲, 吴泉源, 吕建树, 等. 山东省典型金矿区土壤重金属空间特征分析与环境风险评估[J]. 环境科学, 2016, 37(8): 3144-3150.
Wang F, Wu Q Y, Lv J S, et al. Spatial characteristics and environmental risk of heavy metals in typical gold mining area of Shandong Province[J]. Environmental Science, 2016, 37(8): 3144-3150.
[5] 樊新刚, 米文宝, 马振宁, 等. 宁夏石嘴山河滨工业园区表层土壤重金属污染的时空特征[J]. 环境科学, 2013, 34(5): 1887-1894.
Fan X G, Mi W B, Ma Z N, et al. Spatial and temporal characteristics of heavy metal concentration of surface soil in Hebin industrial park in Shizuishan, Northwest China[J]. Environmental Science, 2013, 34(5): 1887-1894.
[6] 罗成科, 毕江涛, 肖国举, 等. 宁东基地不同工业园区周边土壤重金属污染特征及其评价[J]. 生态环境学报, 2017, 26(7): 1221-1227.
Luo C K, Bi J T, Xiao G J, et al. Pollution characteristics and assessment of heavy metals in soil of different industry zones of Ningdong base in Ningxia, China[J]. Ecology and Environmental Sciences, 2017, 26(7): 1221-1227.
[7] 张松林. 西北工业园区盐土重金属污染的盐生植物生态修复研究——以宁夏石嘴山惠农区为例[D]. 重庆: 西南大学, 2020.
Zhang S L. Research on phytoremediation of halophytes for heavy metal pollution of saline soil in northwest industrial park-a case study of Huinong District, Ningxia, China[D]. Chongqing: Southwest University, 2020.
[8] 张慧, 郑志志, 杨欢, 等. 基于多元统计和地统计的肇源县表层土壤重金属来源辨析[J]. 土壤, 2017, 49(4): 819-827.
Zhang H, Zheng Z Z, Yang H, et al. Discrimination of heavy metal sources in topsoil in Zhaoyuan county based on multivariate statistics and geostatistical[J]. Soils, 2017, 49(4): 819-827.
[9] Chen X D, Lu X W, Yang G. Sources identification of heavy metals in urban topsoil from inside the Xi'an Second Ringroad, NW China using multivariate statistical methods[J]. CATENA, 2012, 98: 73-78. DOI:10.1016/j.catena.2012.06.007
[10] 罗帅, 马新月, 王东, 等. 重庆市场地土壤污染特征分析及行业来源识别[J]. 生态环境学报, 2020, 29(4): 810-818.
Luo S, Ma X Y, Wang D, et al. Analysis of soil pollution characteristics and identification of industry sources in contaminated sites in Chongqing city, China[J]. Ecology and Environmental Sciences, 2020, 29(4): 810-818.
[11] 陈秀端, 卢新卫. 基于受体模型与地统计的城市居民区土壤重金属污染源解析[J]. 环境科学, 2017, 38(6): 2513-2521.
Chen X D, Lu X W. Source Apportionment of soil heavy metals in city residential areas based on the receptor model and geostatistics[J]. Environment Science, 2017, 38(6): 2513-2521.
[12] 杨安, 王艺涵, 胡健, 等. 青藏高原表土重金属污染评价与来源解析[J]. 环境科学, 2020, 41(2): 886-894.
Yang A, Wang Y H, Hu J, et al. Evaluation and source of heavy metal pollution in surface soil of Qinghai-Tibet Plateau[J]. Environmental Science, 2020, 41(2): 886-894.
[13] Liang J, Feng C T, Zeng G M, et al. Spatial distribution and source identification of heavy metals in surface soils in a typical coal mine city, Lianyuan, China[J]. Environmental Pollution, 2017, 225: 681-690. DOI:10.1016/j.envpol.2017.03.057
[14] 夏子书, 白一茹, 王幼奇, 等. 基于PMF模型的宁南山区小流域土壤重金属空间分布及来源解析[J]. 环境科学, 2022, 43(1): 432-441.
Xia Z S, Bai Y R, Wang Y Q, et al. Spatial Distribution and source analysis of soil heavy metals in a small watershed in the mountainous area of Southern Ningxia based on PMF model[J]. Environmental Science, 2022, 43(1): 432-441.
[15] Hu W Y, Wang H F, Dong L R, et al. Source identification of heavy metals in Peri-Urban agricultural soils of southeast China: An integrated approach[J]. Environmental Pollution, 2018, 237: 650-661. DOI:10.1016/j.envpol.2018.02.070
[16] 陈锦芳, 方宏达, 巫晶晶, 等. 基于PMF和Pb同位素的农田土壤中重金属分布及来源解析[J]. 农业环境科学学报, 2019, 38(5): 1026-1035.
Chen J F, Fang H D, Wu J J, et al. Distribution and source apportionment of heavy metals in farmland soils using PMF and lead isotopic composition[J]. Journal of Agro-Environment Science, 2019, 38(5): 1026-1035.
[17] 卢鑫, 胡文友, 黄标, 等. 基于UNMIX模型的矿区周边农田土壤重金属源解析[J]. 环境科学, 2018, 39(3): 1421-1429.
Lu X, Hu W Y, Huang B, et al. Source apportionment of heavy metals in farmland soils around mining area based on UNMIX model[J]. Environmental Science, 2018, 39(3): 1421-1429.
[18] Liao S Y, Jin G Q, Khan M A, et al. The quantitative source apportionment of heavy metals in peri-urban agricultural soils with UNMIX and input fluxes analysis[J]. Environmental Technology & Innovation, 2021, 21. DOI:10.1016/j.eti.2020.101232
[19] Norris G, Duvall R, Brown S, et al. EPA Positive Matrix Factorization (PMF) 5.0 Fundamentals and User Guide[EB/OL]. https://cfpub.epa.gov/si/si_public_record_report.cfm?Lab=NERL&direntryid=308292, 2015-08-20.
[20] Feng R, Zheng H J, Gao H, et al. Recurrent Neural Network and random forest for analysis and accurate forecast of atmospheric pollutants: A case study in Hangzhou, China[J]. Journal of Cleaner Production, 2019, 231: 1005-1015.
[21] Fei X F, Christakos G, Xiao R, et al. Improved heavy metal mapping and pollution source apportionment in Shanghai City soils using auxiliary information[J]. Science of the Total Environment, 2019, 661: 168-177.
[22] Li H, Fu P H, Yang Y, et al. Exploring spatial distributions of increments in soil heavy metals and their relationships with environmental factors using GWR[J]. Stochastic Environmental Research and Risk Assessment, 2021, 35(10): 2173-2186. DOI:10.1007/s00477-021-01986-2
[23] Huang H, Zhou Y, Liu Y J, et al. Source Apportionment and ecological risk assessment of potentially toxic elements in cultivated soils of Xiangzhou, China: A combined approach of geographic information system and random forest[J]. Sustainability, 2021, 13(3). DOI:10.3390/su13031214
[24] He X R, Song X J, Pang Y, et al. Distribution, sources, and ecological risk assessment of SVOCs in surface sediments from Guan River Estuary, China[J]. Environmental Monitoring and Assessment, 2014, 186(7): 4001-4012.
[25] Stoji Dc' A, Stoji Dc' S S, Reljin I, et al. Comprehensive analysis of PM10 in Belgrade urban area on the basis of long-term measurements[J]. Environmental Science and Pollution Research, 2016, 23(11): 10722-10732.
[26] 刘斌, 郭星, 朱宇恩. 基于随机森林模型的土壤重金属源解析——以晋中盆地为例[J]. 干旱区资源与环境, 2019, 33(1): 106-111.
Liu B, Guo X, Zhu Y E. Analysis of soil heavy metal sources in Jinzhong basin based on random forest model[J]. Journal of Arid Land Resources and Environment, 2019, 33(1): 106-111.
[27] 张志豪, 陈楠, 祝波, 等. 基于随机森林模型的武汉市城区大气PM2.5来源解析[J]. 环境科学, 2022, 43(3): 1151-8.
Zhang Z H, Chen N, Zhu B, et al. Source analysis of ambient PM2.5 in Wuhan city based on random forest model[J]. Environment Science, 2022, 43(3): 1151-1158.
[28] GB/T 36197-2018, 土壤质量土壤采样技术指南[S].
[29] GB/T 22105.2-2008, 土壤质量总汞、总砷、总铅的测定原子荧光法第2部分: 土壤中总砷的测定[S].
[30] GB/T 22105.1-2008, 土壤质量总汞、总砷、总铅的测定原子荧光法第1部分: 土壤中总汞的测定[S].
[31] GB/T 17141-1997, 土壤质量铅、镉的测定石墨炉原子吸收分光光度法[S].
[32] HJ 491-2019, 土壤和沉积物铜、锌、铅、镍、铬的测定火焰原子吸收分光光度法[S].
[33] HJ 1082-2019, 土壤和沉积物六价铬的测定碱溶液提取-火焰原子吸收分光光度法[S].
[34] Muller G. Heavy metals in the sediments of the rhine-changes since 1971[J]. Umschau in Wissenschaft Und Technik, 1979, 79(24): 778-783.
[35] 李宁, 夏天翔, 刘增俊, 等. 铬渣污染土壤PM10和PM2.5组分中六价铬的生物可给性及健康风险评估[J]. 生态毒理学报, 2019, 14(5): 276-286.
Li N, Xia T X, Liu Z J, et al. Bioaccessibility and health risk assessment of hexavalent chromium in PM10 and PM2.5 fractions of chromium ore processing residue contaminated soils[J]. Asian Journal of Ecotoxicology, 2019, 14(5): 276-286.
[36] Hakanson L. An ecological risk index for aquatic pollution control.a sedimentological approach[J]. Water Research, 1980, 14(8): 975-1001.
[37] 曹莉华, 张天舒, 付佳, 等. 能源型工业园区土壤重金属污染分布特征及污染源研究[J]. 中北大学学报(自然科学版), 2017, 38(2): 209-216.
Cao L H, Zhang T S, Fu J, et al. Distribution characteristics and pollution sources of heavy metal pollution in soil of energy type industrial parks[J]. Journal of North University of China (Natural Science Edition), 2017, 38(2): 209-216.
[38] 中国环境监测总站. 中国土壤元素背景值[M]. 北京: 中国环境科学出版社, 1990.
[39] 王帅, 胡恭任, 于瑞莲, 等. 九龙江河口表层沉积物中重金属污染评价及来源[J]. 环境科学研究, 2014, 27(10): 1110-1118.
Wang S, Hu G R, Yu R L, et al. Pollution assessment and source analysis of heavy metals in surface sediments from Jiulong River Estuary[J]. Research of Environmental Sciences, 2014, 27(10): 1110-1118.
[40] 王玉, 辛存林, 于奭, 等. 南方丘陵区土壤重金属含量、来源及潜在生态风险评价[J]. 环境科学, 2022, 43(9): 4756-4766.
Wang Y, Xin C L, Yu S, et al. Evaluation of heavy metal content, sources, and potential ecological risks in soils of southern hilly areas[J]. Environment Science, 2022, 43(9): 4756-4766.
[41] Liu J W, Chen Y J, Chao S H, et al. Emission control priority of PM2.5-bound heavy metals in different seasons: A comprehensive analysis from health risk perspective[J]. Science of the Total Environment, 2018, 644: 20-30.
[42] Gao J J, Tian H Z, Cheng K, et al. Seasonal and spatial variation of trace elements in multi-size airborne particulate matters of Beijing, China: Mass concentration, enrichment characteristics, source apportionment, chemical speciation and bioavailability[J]. Atmospheric Environment, 2014, 99: 257-265.
[43] Yang H N, Chen J, Wen J J, et al. Composition and sources of PM2.5 around the heating periods of 2013 and 2014 in Beijing: Implications for efficient mitigation measures[J]. Atmospheric Environment, 2016, 124: 378-386.
[44] Breiman L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.
[45] Huang L, Zhu Y H, Zhai H H, et al. Recommendations on benchmarks for numerical air quality model applications in China - Part 1: PM2.5 and chemical species[J]. Atmospheric Chemistry and Physics, 2021, 21(4): 2725-2743.
[46] Team R C. R: A language and environment for statistical computing[EB/OL]. https://www.semanticscholar.org/paper/R%3A-A-language-and-environment-for-statistical-Team/659408b243cec55de8d0a3bc51b81173007aa89b, 2022-08-24.
[47] GB 36600-2018, 土壤环境质量建设用地土壤污染风险管控标准(试行)[S].
[48] Liu J, Chen Y, Chao S, et al. Levels and health risks of PM2.5-bound toxic metals from firework/firecracker burning during festival periods in response to management strategies[J]. Ecotoxicology and Environmental Safety, 2019, 171: 406-413.
[49] 吕博, 赵玲双, 刘赟妮, 等. 汞污染的来源及修复技术[J]. 现代农业科技, 2017(1): 188.
[50] Lv J S, Liu Y, Zhang Z L, et al. Factorial kriging and stepwise regression approach to identify environmental factors influencing spatial multi-scale variability of heavy metals in soils[J]. Journal of Hazardous Materials, 2013, 261: 387-397.
[51] Li Y, Wang Y B, Gou X, et al. Risk assessment of heavy metals in soils and vegetables around non-ferrous metals mining and smelting sites, Baiyin, China[J]. Journal of Environmental Sciences, 2006, 18(6): 1124-1134.
[52] 朱晓丽, 薛博倩, 李雪, 等. 基于PMF模型的宝鸡铅锌尾矿库周边农田土壤重金属源解析[J]. 西北大学学报(自然科学版), 2021, 51(1): 43-53.
Zhu X L, Xue B Q, Li X, et al. Sources apportionment of heavy metals in farmland soil around lead-zinc tailings reservoir based on PMF model[J]. Journal of Northwest University (Natural Science Edition), 2021, 51(1): 43-53.
[53] 柴磊, 王新, 马良, 等. 基于PMF模型的兰州耕地土壤重金属来源解析[J]. 中国环境科学, 2020, 40(9): 3919-3929.
Chai L, Wang X, Ma L, et al. Sources appointment of heavy metals in cultivated soils of Lanzhou based on PMF models[J]. China Environmental Science, 2020, 40(9): 3919-3929.
[54] 蒋成爱, 吴启堂, 陈杖榴. 土壤中砷污染研究进展[J]. 土壤, 2004, 36(3): 264-270.
Jiang C A, Wu Q T, Chen Z L. Arsenic contamination in the soil[J]. Soils, 2004, 36(3): 264-270.
[55] Zhang T, Liu F, Yu X Z, et al. Risk assessment and ecotoxicological diagnosis of soil from a chemical industry park in Nanjing, China[J]. Ecotoxicology, 2021, 30(7): 1303-1314.
[56] 乔红雍. 施肥对农田表层土壤重金属含量的影响及污染评价[D]. 北京: 北京林业大学, 2020.
Qiao H Y. Effect of fertilization on the heavy metal content and pollution evaluation of farmland topsoil[D]. Beijing: Beijing Forestry University, 2020.
[57] 陈景春, 易廷辉, 陈丽. 重庆市市售化肥重金属含量调查分析[J]. 湖南农业科学, 2017(6): 41-44.
Chen J C, Yi T H, Chen L. Investigation of heavy metal concentrations of commercial fertilizers in Chongqing[J]. Hunan Agricultural Sciences, 2017(6): 41-44.
[58] Kartal Ş, Aydın Z, Tokalıo Dǧlu Ş. Fractionation of metals in street sediment samples by using the BCR sequential extraction procedure and multivariate statistical elucidation of the data[J]. Journal of Hazardous Materials, 2006, 132(1): 80-89.
[59] Cloquet C, Carignan J, Libourel G, et al. Tracing source pollution in soils using cadmium and lead isotopes[J]. Environmental Science & Technology, 2006, 40(8): 2525-2530.
[60] 黎伟田. 湖南柿竹园矿区及周边土壤镉污染分布特征与来源研究[D]. 北京: 中国地质大学(北京), 2018.
Li W T. Distribution characteristics and sources of Cd-contamination in Shizhuyuan mine and its surrounding soils, Hunan Province[D]. Beijing: China University of Geosciences (Beijing), 2018.
[61] 常慧. 贵州省典型污染区镉的空间分布和来源识别——以万山汞矿区为例[D]. 北京: 中国地质大学(北京), 2019.
Chang H. Spatial distribution and source identification of cadmium in typical polluted areas of Guizhou Province: A case study of Wanshan mercury mine[D]. Beijing: China University of Geosciences (Beijing), 2019.
[62] Jiang Y X, Chao S H, Liu J W, et al. Source apportionment and health risk assessment of heavy metals in soil for a township in Jiangsu Province, China[J]. Chemosphere, 2017, 168: 1658-1668.
[63] Jiang H H, Cai L M, Wen H H, et al. An integrated approach to quantifying ecological and human health risks from different sources of soil heavy metals[J]. Science of the Total Environment, 2020, 701. DOI:10.1016/j.scitotenv.2019.134466
[64] 郑袁明, 陈煌, 陈同斌, 等. 北京市土壤中Cr, Ni含量的空间结构与分布特征[J]. 第四纪研究, 2003, 23(4): 436-445.
Zheng Y M, Chen H, Chen T B, et al. Spatial distribution patterns of Cr and Ni in soils of Beijing[J]. Quaternary Sciences, 2003, 23(4): 436-445.
[65] 万红友, 周生路, 赵其国. 苏南经济快速发展区土壤Ni的形态分布影响因素——以昆山市为例[J]. 农业环境科学学报, 2010, 29(10): 1953-1959.
Wan H Y, Zhou S L, Zhao Q G. Factors influencing chemical forms of soil Ni in the rapidly developing region of south Jiangsu Province——A case study from Kunshan city[J]. Journal of Agro-Environment Science, 2010, 29(10): 1953-1959.
[66] Duong T T T, Lee B K. Determining contamination level of heavy metals in road dust from busy traffic areas with different characteristics[J]. Journal of Environmental Management, 2011, 92(3): 554-562.
[67] Xu Y, Shi H D, Fei Y, et al. Identification of soil heavy metal sources in a large-scale area affected by industry[J]. Sustainability, 2021, 13(2). DOI:10.3390/su13020511
[68] 张瑞. 某典型工业园周边农田土壤重金属的健康风险评估及来源解析[D]. 杨凌: 西北农林科技大学, 2020.
Zhang R. Health risk assessment and source apportionment of heavy metals in farmland soil around a typical industrial park[D]. Yangling: Northwest A&F University, 2020.