环境科学  2017, Vol. 38 Issue (5): 2111-2124   PDF    
广东省土壤Cd含量空间分布预测
孙慧1,2 , 郭治兴2 , 郭颖1,2 , 袁宇志2 , 柴敏2 , 毕如田1 , 杨静1     
1. 山西农业大学资源环境学院, 晋中 030800;
2. 广东省生态环境技术研究所, 广东省农业环境综合治理重点实验室, 广州 510650
摘要: 土壤重金属的空间格局对土壤重金属污染防治具有重要的指导意义.本文以广东省土壤Cd含量为研究对象,基于"规则"模型——Cubist以及样条插值法、反距离加权法、自然邻域法、普通克里金插值法、局部多项式插值法和径向基函数插值法等6种GIS空间插值方法,选取2000、1500、1000、800、500、300、200、150及90 m这9个不同的格网尺度,构建Cd含量空间格局模型.选择不同方法的最佳预测尺度和最优模型参数,预测广东省土壤Cd含量分布.结果表明:1在相同尺度时Cubist方法预测结果都比传统的空间插值结果精度高,格网大小为300 m×300 m时预测精度最高.其次是样条插值法,其在1500 m插值尺度上精度最高;2Cubist模型同时可以识别土壤Cd含量空间分布的驱动因子.结果表明在37个影响Cd含量的自然和人为因子中,地质类型是驱动广东省土壤Cd含量分布差异的主要因子;3Cd含量高值主要分布在珠三角地区及粤北少部分地区.广东省土壤Cd含量超过GB 15618-1995中3级和2级标准,即大于1.0 mg·kg-1和0.3 mg·kg-1的面积分别约为160 km2和2140 km2,约占广东省总面积的0.09%和1.18%.
关键词: 空间分布      土壤Cd含量      广东      Cubist      驱动因子     
Prediction of Distribution of Soil Cd Concentrations in Guangdong Province, China
SUN Hui1,2 , GUO Zhi-xing2 , GUO Ying1,2 , YUAN Yu-zhi2 , CHAI Min2 , BI Ru-tian1 , YANG Jing1     
1. College of Resources and Environment, Shanxi Agriculture University, Jinzhong 030800, China;
2. Guangdong Key Laboratory of Agro-Environment Integrated Control, Guangdong Institute of Eco-Environmental Science & Technology, Guangzhou 510650, China
Abstract: Heavy metals are one of the principal soil pollution sources. Contaminated soils affect the quality of agricultural products, and then threaten human health. Prediction of the contaminants distribution in the soil is the foundation of pollution evaluation and risk control. A total of 1000 soil profiles were collected to investigate the spatial variation of soil cadmium (Cd) concentration in Guangdong province. These datasets were divided into two groups, about 900 samples for model training and the other 100 for model validation. Six frequently used GIS spatial interpolation methods including Spline, Natural Neighbor, Ordinary Kriging, Inverse Distance Weighted, Local Polynomial Interpolation and Radial Basis Function, and Cubist which is a type of rule-based model were compared to determine their suitability parameters for estimating soil Cd concentration. Nine different resolutions including 2000, 1500, 1000, 800, 500, 300, 200, 150, and 90 m were selected to calculate, evaluate and compare their accuracy. The results showed that, 1 Quantitative assessment of the continuous surfaces showed that there was a large difference in the accuracy of the seven methods. Cubist was superior to GIS-based spatial interpolation methods at all resolutions. Cubist was the best tool for mapping the spatial distribution of Cd in soils with thirty-seven specific predictors relevant to the source and behavior of Cd (parent material, land use, soil type, soil properties, population density, gross domestic product per capita, and the lengths and classes of the roads surrounding the sampling sites, climatic factors, etc.) at 300 m×300 m resolution. The second was Spline, its accuracy was optimal at the 1500 m×1500 m resolution. 2 Results of Cubist suggested that the soil Cd spatial distribution was primarily dependent on the properties of soil regional parent materials. And soil samples with higher Cd concentration mainly located in Carboniferous and Quaternary areas. 3 Spatially, Cd concentrations were higher in the Pearl River Delta region and north of Guangdong Province. Many hotspots existed throughout the Pearl River Delta region due to transportation and pollution of the river. The major anthropogenic inputs of heavy metals to soils and the environment were metalliferous mining and smelting in the north of Guangdong Province. The soil Cd geometric mean concentration of 0.147 mg·kg-1 was lower than that of China, however it varied from zero to 6.056 mg·kg-1. The areas with soil Cd concentrations greater than 1.0 and 3.0 mg·kg-1 were 160 km2 and 2140 km2 respectively, accounting for 0.09% and 1.18% of the total area of Guangdong Province.
Key words: spatial distribution      soil Cd concentrations      Guangdong      cubist      driving factors     

自然界Cd元素一般存在于页岩、海洋、湖相沉积物和磷灰石中[1],主要受地质作用影响[2],一般含量较低.随着人类活动的不断加强,包括工业生产加速、快速城市化、道路密度的增大、人口密集化、电子垃圾焚烧、工业三废的排放、化肥农药的施用、汽车尾气排放、矿业开采和金属冶炼等导致土壤Cd含量迅速增加[1, 3, 4]. Cd的危害性众所周知[5],尤其是土壤中Cd元素由于不容易被降解[6],随食物链进入人体后会对健康造成极大的伤害[7].因此,土壤Cd污染一直是各国家的学者们研究的重点内容之一[8].而预测土壤Cd含量的分布及其驱动因子是防治土壤Cd污染的基础[9].由于发展不均衡及含Cd较高的土壤母质等原因导致了广东省土壤Cd含量分布极不平衡,例如,广东省北部地区含有大量有色金属矿区造成粤北地区Cd含量的偏高[10~12],由于广东省主要经济力量集中在珠三角地区造成了珠三角地区Cd含量的偏高[13].因此,识别土壤Cd含量空间分布的驱动因子及精确掌握广东省土壤Cd含量的分布情况对指导相关产业布局及制定相关政策具有重要的意义[14].

用于预测土壤重金属空间分布的方法很多[15],大体上包括GIS空间插值方法、分类回归树、分类法和一般线性模型等.常用的GIS空间插值方法包括克里金、反距离加权、局部多项式、径向基函数、样条插值、自然邻域等[16],本质上都是利用采样点位置及采样点间的距离进行分析插值.分类法例如fuzzy classification等,将土壤重金属含量分为若干类别,从而预测未知样点与各类别的隶属度进行空间预测[17],通常与其他插值方法联合使用.一般线性模型则根据预测值与相关因子建立模型进行预测[18],它能够处理的因子数量有限,且并不能处理离散变量.分类回归树方法包括叶节点是值和叶节点为模型两种不同的类型,利用被预测值和相关因子的的关系构建回归树进行预测[19, 20],叶节点为值的模型只能将结果分成不同值区间的类别.通常野外采集样点的过程不仅仅只是采集样品,采样点周边以及采样点的其他土壤属性也会一并被搜集到,而传统的GIS空间插值方法及分类法不能够充分利用这些额外变量.虽然协克里金方法可以利用额外变量,但是仅支持使用有限的连续变量,且计算过程相当耗时,因此基于传统的GIS空间插值方法及分类法等并不能够充分利用现有全部信息并直接快速识别土壤重金属空间分布的驱动因子.此外,使用基于距离的空间插值方法必须分析数据的空间异质性并以数据是否符合正态分布作为前提条件.

基于规则的模型 (Rule-Based Model) 既可以识别离散变量又可以识别连续变量,对土壤Cd含量进行空间预测.本文基于广东省1 000个采样点,对比基于规则的模型——Cubist方法[21]及传统GIS空间插值方法[16],选择最高精度的预测模型分析广东省土壤Cd含量分布情况并解析其驱动因子.

1 材料与方法 1.1 研究区概况

广东省位于北纬20°09′ ~25°31′、东经109°45′~117°20′之间 (图 1),全省陆地面积约180 000 km2.广东省地貌类型复杂多样,地势北高南低,粤北地区多为山区,珠三角地区多为平原和台地.地貌共有8个大类和55类地貌类型,广东省地貌的形成年代可以追溯到白垩纪[22],但主要地质时期为燕山期和第四纪,其次是石炭纪和泥盆纪.广东省矿产资源丰富,尤其是粤北地区有色金属及稀有金属资源极其丰富.广东省气候带类型由北到南依次为中亚热带、南亚热带及北热带,年平均气温约为19~24℃,光热水资源充沛,农业生产较发达.广东省位于华南典型红壤区,土壤类型以潴育水稻土、红壤、黄壤为主,土壤主要呈酸性,pH均值大约在5.44左右[23].广东省经济发展迅速、城镇化水平极高,但是发展很不平衡,珠三角地区的国民生产总值远远高于省内其他地区,是我国经济发展和城市化发展大省,同时也是国内土壤重金属污染较为严重的省份之一[24, 25].

图 1 采样点分布示意 Fig. 1 Distribution of sampling points

1.2 数据来源与处理

采集广东省0~20 cm表层土壤样本,采样点基本覆盖整个广东省,包括不同土壤类型、地质类型和土地利用类型的样本.每个样本在其周围10 m×10 m的正方形内共采集4个顶点和中心点共5个点的土样,每个样点采集1 kg左右混合均匀后取1 kg代表该样点,同时用GPS记录中心样点的经纬度代表该样本的位置,共采集1 000个样本点.在室内土样经盐酸-硝酸-高氯酸消解,Cd含量值按GB/T 17141-1997石墨炉原子吸收分光光度法测得,仪器为日本日立公司生产的日立Z-2000系列原子吸收分光光度计,分析过程均加入国家标准土壤样品 (GSS-17和GSS-19) 进行分析质量控制.

Cubist方法需要选择影响土壤Cd含量的自变量因子,本研究根据相关报道[6, 26, 27]选取37个可以实现空间化的自然和人为因子.数据来源于人口经济数据、土地利用数据、DEM数据、土壤类型、土壤pH值、地质系类型、气候数据、TM影像等,因子处理方式如表 1所示.在ArcGIS 10.0中将37个因子栅格化,分别得到2 000、1 500、1 000、800、500、300、200、150和90 m这9种不同尺度的栅格数据;其他6种GIS空间插值方法利用交叉验证的方法确定最优预测参数,为了比较预测结果同样选择上述9种插值尺度,由于克里金方法需要数据符合正态分布,为了保障一致性在预测时将Cd含量数据进行对数转换.

表 1 变量因子描述 Table 1 Description of variables

1.3 分析方法 1.3.1 Cubist

Cubist是基于规则的模型,属于分类回归树的一种,每一条规则被定义为一棵树的一个单独路径,而树的节点是一系列的线性模型[28].预测时将数据空间划分为若干个子空间,分别对子空间数据建模,利用分段建立线性模型的方式拟合预测值和因子值之间的曲线模型从而提高预测精度[29].基于“规则”模型本质是机器学习,可以实现对大数据的挖掘,实现在上百个因子中快速识别预测值的相关因子并建立模型[28],Cubist的组织形式如下.

If   [条件]   then  线性模型

例如:

 Rule 1:

  If

   pH≤r

   土壤类型=(p, q, s)

  Then

   ln (Cd)=b1+ b2×pH…

Rule n

  If

   pH≥r

   土壤类型=(l, m, n)

  Then

   ln (Cd)=a1a2×pH…

式中,r是数值型连续自变量值,pqslmn是离散的分类自变量值,biai是线性模型系数.如果自变量值满足其中一条规则,则预测值用该规则的线性模型预测.如果自变量值同时满足多个规则,则用这些规则预测值的平均值作为最终预测值.

Cubist规则的建立方法与回归树模型类似,详尽的对自变量值和训练数据集搜索遍历后找到最初的分裂,通过不断减小叶节点的错误率来调整分裂结果.令S表示这个数据集,S1, …, Si, …, SP代表S将被分裂的P个子集,那么分裂的标准就表示为:

式中,sd表示标准差,ni表示分区样本个数.这个公式决定每个样本的加权变异是否比预分裂的数据低.当误差减少到最小时分裂被确定,而分裂后的线性模型利用分裂区的变量进行无偏估算[28].这样就将原本的空间划分成了若干个子空间,相当于用分段线性模型模拟自变量和因变量之间的非线性关系. Cubist的另一个优势在于模型结果计算条件分裂自变量和线性模型自变量的贡献率,可以从模型结果中直接找出影响模型的主要因子.

本文利用R 3.2.2[30]及Cubist 0.0.18[31],以Cd含量的对数作为因变量,37个因子数据作为自变量,使用自变量的不同格网数据值的900个样点分别构建模型,如果模型结果的相对误差小于1则模型可用[32].结果表明,当格网大小为1 000 m×1 000 m、500 m×500 m、300 m×300 m、200 m×200 m、150 m×150 m时,Cubist模型的相对误差小于1,模型可用;当格网大小为2 000 m×2 000 m,1 500 m×1 500 m,800 m×800 m,90 m×90 m时,Cubist模型的相对误差大于1,模型不可用.

1.3.2 GIS空间预测方法

(1) 反距离加权法

反距离加权法 (Inverse Distance Weighted, IDW) 以预测点与样本点之间的距离为权重进行插值,距离预测点越近的样本点赋予的权重越大,其权重贡献与距离成反比[33].预测点值的计算公式为:

式中,Z(x) 为预测点的预测值,n表示预测值周围的已知点的邻近值,zi为邻近值的样本值,wi为权重函数,权重函数简单地表示为:

式中,d表示预测点距离邻近样本点的距离,p的取值范围0.5~3.

(2) 样条插值法

样条插值法 (Spline) 利用二维最小曲率样条技术将采样点数据插值为一个栅格表面.其结果是得到一个精确通过每个采样点的光滑表面[34].预测点的预测方法为:

式中,n为预测点已知邻近点的个数,邻近点越多,较远的数据点对预测点的影响就越大,输出的表面就越平滑,λi是线性方程系数,ri是预测点 (x, y) 到第i个已知点的距离.样条插值函数包括规则样条函数和张力样条函数,所以T(x, y) 和R(r) 的求解方法对应有两种.

(3) 自然邻域法

自然邻域 (Natural Neighbor, NN) 法与反距离加权方法类似,也是基于距离权重插值的方法.与反距离加权法不同,自然邻域法是通过由预测点的三角网与已知点确定的三角网的重叠区域的比例确定的[35].

(4) 普通克里金

普通克里金 (Ordinary Kriging, OK) 是最常用的插值方法,它是通过对周围的测量值进行加权以得出未测量位置的预测值,类似于反距离加权法,插值公式同样为数据的加权总和:

式中, Z(si) 表示第i个位置的测量值,Z(s0) 表示位于s0处的预测值,λi表示已知点i的权重值,n表示测量值的数量.不同于反距离加权法,普通克里金的权重不仅取决于预测点的位置、距离,同时还考虑预测点在空间上的整体排列,即通过量化空间自相关性来确定,这就需要通过创建变异函数和协方差函数估算自相关模型.首先需要进行变异分析,通过对距离h分割的所有位置对计算经验变异函数图,构建方法为:

式中,Semivariogram (distanceh) 表示所有样点对距离为h时的半方差图,计算方式为所有距离为h的两样点实际值差的平方的均值的一半,valuei、valuej分别为已知点i、j位置的实际值.之后根据经验变异函数图拟合模型.普通克里金插值方法提供了圆、球面、四球、五球、指数、高斯、有理二次方程式、孔洞效应、K-Bessel、J-Bessel和稳健模型等拟合模型.最后通过拟合的模型和插值方法对位置点进行空间预测.

(5) 局部多项式

局部多项式 (Local Polynomial Interpolation, LPI) 通过使用多项式包括零阶、一阶、二阶、三阶等多项式,在指定的搜索邻域内拟合一个输出面局部多项式[36].通过使用邻域数量、搜索半径、搜索方向等将整个表面划分成许多区域,对不同的指定区域利用多项式拟合样点,构建一个曲面来预测未知位置的值.例如将搜索区域设置为圆形,半径为R,di是预测点 (xiyi) 到已知点 (x,y) 的距离,则权重wi表示为:

然后使用最小二乘法确定预测点的值,使误差最小:

式中,f(xi, yi) 是局部多项式中指定函数的一种,n是邻近样点个数.

(6) 径向基函数

径向基函数 (Radial Basis Functions, RBF) 通过使用5个基函数包括薄板样条函数、张力样条函数、规则样条函数、高次曲面函数、反高次曲面函数来处理样本值,从而创造一个精确的插值曲面[36].径向基函数是样条插值法的一个特例,插值函数与样条插值函数类似,只是权重的确定方法不一样.径向基函数还类似于反距离加权法,但是反距离加权法不会预测大于测量值和小于测量值的值,而径向基函数可以.径向基函数根据大量数据点生成平滑表面,在每个样点处都会生成一个径向基函数,是一个距离函数.

1.4 精度验证

从1 000个采样点中按分层抽样的方法抽取900个点作为预测数据,将剩余的100个点作为验证数据,验证不同方法预测结果的精度.对验证数据和预测数据的Cd含量对数值进行K-S检验[37],结果D=0.128 89,P=0.100 5,P>0.05,表明两组数据的分布来自于同一母体.比较验证数据集与预测值相关系数大小,使用独立样本验证用于检测预测方法对未知样点的预测能力.

表 2是通过交叉验证确定的6种GIS空间插值的最佳参数.为了与其他方法预测结果进行对比,使用统一的900个预测数据进行插值,并使用同样的100个验证数据对结果进行验证.自然邻域法在插值尺度为1 500 m时的预测精度最高;径向基函数插值法在插值尺度为1 000 m,插值方法为多重二次曲面,预测精度最高;局部多项式插值法在插值尺度为1 500 m,插值方法为五次多项式,预测精度最高;反距离加权法在预测尺度为1 000 m且power参数设置为0.5,以及搜索邻域值为11时预测精度最高;普通克里金插值法在插值尺度为1 500 m,插值方法为J-Bessel,预测精度最高;样条插值法在插值尺度为1 500 m,选择常规样条插值方法,权重参数设置为35,邻域值设置为10时精度最高. Cubist的验证结果表明,当格网大小为300 m×300 m时,Cubist预测精度最高.

表 2 GIS空间插值最优参数 Table 2 Optimal parameters of 6 GIS interpolation methods

2 结果与讨论 2.1 Cd含量统计特征

表 3是1 000个样点的Cd含量值统计情况,其中Cd含量最小值为0.000 2 mg ·kg-1,最大值为6.056 mg ·kg-1,平均值为0.147 mg ·kg-1,标准差为0.352 mg ·kg-1.根据GB 15618-1995土壤环境质量标准及相关标准[38]中土壤Cd含量的限制值标准,0.2 mg ·kg-1为土壤Cd含量自然背景值,低于土壤Cd含量背景值的点占83.3%;超过三级标准限制值1.0 mg ·kg-1的点占1.5%;广东省总体Cd含量均值在二级标准限制值以下.将Cd含量按照土壤环境质量标准分为6个不同类别,第一类别: Cd < 0.1 mg ·kg-1和第二类别: 0.1 mg ·kg-1 < Cd < 0.2 mg ·kg-1,第一类别和第二类别的Cd含量低于自然背景值;第三类别: 0.2 mg ·kg-1 < Cd < 0.3 mg ·kg-1,第四类别: 0.3 mg ·kg-1 < Cd < 0.6 mg ·kg-1,土壤环境质量标准中Cd含量二级标准限制值在土壤pH小于7.5时是0.3 mg ·kg-1,当土壤pH值大于7.5时为0.6 mg ·kg-1,第三类别和第四类别是为保障农业生产,维护人体健康的土壤限制值;第五类别: 0.6 mg ·kg-1 < Cd < 1.0 mg ·kg-1、第六类别: Cd>1.0 mg ·kg-1.其中.第四类别、第五类别、第六类别属于Cd含量高级水平,可能对人体健康构成威胁.从表 2可以看出,62.4%样点的Cd含量都分布在第一类即Cd含量小于0.1 mg ·kg-1.

表 3 Cd含量统计情况 Table 3 Statistics of Cd concentrations

2.2 预测结果对比分析

利用900个采样点的Cd对数值进行空间预测,并利用剩余100个采样点的Cd对数值作为验证数据集,分别筛选全部7种方法的最佳预测参数和最佳预测尺度. 表 4是每一种方法的最优预测结果.结果表明Cubist的预测精度最高,其次是样条插值法;自然邻域法的预测精度最低.

表 4 不同插值结果对比 Table 4 Comparison of different interpolation results

图 2是不同插值方法在不同插值尺度上的预测精度,其表明自然邻域法 (NN) 的插值精度在所有插值尺度都是最低的,反距离加权法 (IDW)、径向基函数法 (RBF)、局部多项式法 (LPI) 的趋势基本一致,样条插值法 (Spline) 的精度在6种GIS插值方法中是最高的.另外,图 2还表明样条插值法 (Spline)、反距离加权法 (IDW)、径向基函数法 (RBF) 和局部多项式法 (LPI) 的预测精度基本不受尺度的影响.普通克里金插值方法 (OK) 和自然邻域法分别在500 m和800 m预测尺度上出现低谷. Cubist插值方法受尺度的影响较大,是因为不同因子在不同尺度上对模型的贡献作用是不同的.

图 2 不同插值方法在不同尺度的预测精度 Fig. 2 Prediction accuracy of different interpolation methods at different scales

图 3是7种不同方法预测的广东省土壤Cd含量分布情况,7个预测结果的土壤Cd含量的分布情况大体一致,Cd含量高值均分布在粤北地区和珠三角地区.但是普通克里金插值方法 (OK)、局部多项式法 (LPI) 和反距离加权法 (IDW) 预测结果都对高值进行了平滑,反距离加权法 (IDW) 和局部多项式法 (LPI) 的插值结果中缺失了第六类别,普通克里金 (OK) 插值结果丢失了第五类别和第六类别.自然邻域法 (NN) 和径向基函数方法 (RBF) 预测结果基本一样,对Cd含量最高值的预测都分布在粤北地区,预测结果简单地以高值-中高值-较高值-低值的同心圆模式分布,预测结果受最高值和最低值的影响较大,因此不能很好地预测验证点. Cubist预测结果避免了同心圆和牛眼效应,且不会存在值的缺失,不会对最高值进行平滑,且用验证样本预测的精度较高.

图 3 最优参数和最佳尺度组合预测结果 Fig. 3 Predicted results of different methods with optimal parameters and optimal scales

2.3 Cd含量空间分布

利用最佳预测方法——Cubist的最优模型预测广东全省在300 m×300 m尺度下的土壤Cd含量,其分布情况如图 3“Cubist”所示. 表 5是Cubist预测的广东省土壤Cd含量预测值各类型的面积.结果表明,广东省土壤Cd含量整体上处于较低的水平,土壤Cd含量值基本小于自然背景值0.2 mg ·kg-1,其中一类和二类面积占广东省国土面积的94.96%.但是,近30年来,珠江三角洲地区发展迅猛,从起初以传统的农业和手工制造业到现在以工业和技术生成为主的地区,在发展过程中随着经济的增长和人口的增多,产生了巨大的工业和生活垃圾,工业和生活废水等不断渗入土壤,造成了土壤的污染,致使土壤Cd含量迅速增高[39, 40].粤北地区尤其是韶关和清远,该区矿产丰富,现已开采了大量的矿山.韶关矿山开采中产生的废水和冶炼厂产生的废水、废气,以及清远市电子垃圾处理产生的废渣、废气等中含有大量的重金属元素,对其周边土壤造成了污染[41~44].土壤Cd含量超过二级标准限制值0.3 mg ·kg-1的预测值大致分布在珠三角地区和粤北少部分地区.可能对人体健康构成危害即第四、五、六类的面积占广东省总面积的1.18%;土壤Cd含量临界值即三类面积占广东省总面积的3.86%.

表 5 土壤Cd含量预测值各类型面积统计 Table 5 Area statistics of predicted results for soil Cd content

图 4是广东省土壤Cd含量值较高的区域,图 4(a)显示土壤Cd含量高值区大致分布在广州和佛山的交界处、中山和珠海的交界处、中山和江门的交界处、广州与东莞的交界处以及东莞和惠州的交界处,这些高值区基本分布在城市交界处,朱永官等[45]研究表明东莞-增城南部-广州-佛山-三水一带是珠江三角洲水土污染最严重的区域.高速发展的经济和快速城镇化[46],尤其是市交界处土地的高强度利用导致大量Cd元素流入土壤中[47],造成土壤Cd含量偏高.江门-中山-珠海及广州-东莞-惠州交界为河流,Cd含量高值区沿河流分布,表明河流冲击、沉淀等携带的Cd元素造成周边土壤Cd含量偏高.广州-佛山交界位于广东省珠三角地区,地势平坦,地处低洼地区,是广东省整个水系入海的必经之路,由此而携带的大量Cd元素造成土壤Cd元素的富集累积.预测结果显示荔湾区、珠海区和越秀区的土壤Cd含量值是广东省最高的3个地区,其Cd含量值均超过0.1 mg ·kg-1,研究结果与Lu等[48]一致.越秀区为老城区,有超过2000年的人类活动历史如煤炭燃烧,此外,一些城市公园曾经是市政和工业废物的一个垃圾倾倒场,这都导致土壤中的Cd含量升高[48].

(a) 珠三角,(b) 粤北 图 4 Cd含量预测高值区 Fig. 4 Predicted regions of high Cd concentrations

图 4(b)显示Cd含量另一个高值主要集中分布在清远的连州市、英德市以及韶关的乐昌市东南部小部分地区,其中Cd含量最高值出现在连州市.这些高值分布在高速公路周边.道路交通中轮胎摩擦和润滑油燃烧会产生Cd等重金属,刹车里衬磨损也会产生Cd等重金属[49],这些Cd元素通过路面溅射扬尘扩散或地表径流进入两边的土壤中造成土壤Cd污染[50~52];此外,图 4(b)显示采矿用地分布在该道路两侧,矿石运输过程加剧了该道路两侧Cd的污染.粤北地区矿产丰富,是该地区主要经济支柱.现今开采的矿区主要位于韶关市,包括韶关的大宝山矿区、韶关冶炼厂、凡口铅锌矿、乐昌铅锌矿等,矿产的开采和冶炼等人类活动造成了土壤重金属的污染[53].英德市位于北江流域的中下游,韶关矿区位于北江流域上游,因此而产生的工业废水随河流流入中下游,对英德市造成严重的Cd污染[54, 55].

图 5是广东省各市Cd含量预测统计情况,广东省各市土壤Cd含量预测值的统计情况中,其中潮州市、汕头市、湛江市、中山市和珠海市Cd含量的最小值均大于0,表明这5个市的Cd含量自然背景值较高.除了茂名市、阳江市,其他各市Cd含量最大值均超过土壤环境质量2级标准限制值0.3 mg ·kg-1,其中佛山市、广州市、河源市、清远市、韶关市Cd含量最高值已经超过土壤环境质量3级标准0.6 mg ·kg-1.佛山市和广州市的土壤Cd含量均值超过土壤环境质量一级标准0.2 mg ·kg-1,但是佛山市和广州市土壤Cd含量标准差较大,表明最大值和最小值之间差距较大.广东省各市土壤Cd含量不同类别的面积分布情况中,其中受污染最严重的是佛山市,其18.08%的面积超过土壤环境质量二级标准限制值0.3 mg ·kg-1.其次是广州市,其10.46%的面积超过土壤环境质量二级标准限制值.东莞、中山、清远、深圳分别有4.32%、3.15%、1.9%、1.38%超过土壤环境质量二级标准限制值0.3 mg ·kg-1.

图 5 广东省各市Cd含量统计情况 Fig. 5 Statistics of Cd concentrations in the cities of Guangdong province

2.4 Cd含量分布驱动因子分析

表 6是Cubist的5个不同尺度可用模型的预测结果,其中主要条件影响因子是对模型分规则贡献值最高的因子.主要模型因子是模型中对线性模型贡献率最高的因子. 5种尺度模型主要条件影响因子均为地质类型,说明整体上广东省土壤Cd含量分布情况主要受地质的影响,土壤中天然的Cd元素一般来源于地质作用[56],与土壤母质有很大的关系,Zhang等[3]研究也表明广东省土壤Cd含量的分布受地质的影响.当格网尺度为300 m×300 m时,模型的主要局部影响因子是人口密度、道路密度、年均气温、植被、pH、距一级支流距离、据采矿用地距离等,表明在300 m尺度上各因子对Cd含量的影响都表达出来.

表 6 Cubist模型预测结果 Table 6 Predicted results of Cubist

图 6是格网300 m×300 m尺度下Cubist的4个不同规则预测的Cd含量分布情况以及规则4条件中6个地质类型的分布,图 6显示由规则1和规则2预测的Cd含量值基本上均小于0.2 mg ·kg-1,而Cd含量高值基本均由规则4预测.规则4预测的结果大致分布在珠江三角洲、粤北、广州西南角和粤东部分地区,与Cd含量高值区分布情况一致. 表 7是格网300 m×300 m尺度Cubist预测的模型的4个规则及其各规则的条件.从中可以看出,每一条规则的分类因子都有地质类型,表明地质类型对广东省土壤Cd含量的分布有重要的作用.规则4的条件是地质类型为奥陶系、第四系、二叠系、新近纪、石炭系和古近纪.其中石炭系主要分布在粤北地区,粤北地区的高含量高值区域与石炭系的分布情况重叠[3],石炭系一般含有煤矿,而中国煤矿含有Cd含量0.04~1.2 mg ·kg-1[63],致使粤北地区Cd含量背景值偏高;第四系主要分布在珠三角地区,珠三角的Cd含量高值区域分布与第四系分布区域重合[64],第四纪松散沉积物母质表层土壤相对富集Cd元素,导致珠三角地区Cd含量背景值偏高[64];石炭系、第四纪与粤北地区、珠三角地区的重合造成这两个地区自然背景下的Cd含量比其他地区高.而其他3个规则中的地质类型分布情况与Cd含量低值区分布情况重合.广东省Cd含量分布情况受地质类型影响,分布情况与地质类型分布基本一致,且模型结果显示地质类型在条件中的贡献率是100%,表明地质类型是驱动广东省土壤Cd含量的主要因子.

图 6 Cubist不同规则预测的Cd含量分布情况及地质类型分布 Fig. 6 Distribution of Cd concentrations predicted by Cubist rules and the geological distribution

表 7 Cubist模型的不同规则 Table 7 Rules of Cubist model

3 结论

(1) Cubist方法在300 m尺度时预测精度最高,其次是样条插值方法在1 500 m尺度时预测精度.克里金、局部多项式插值法和反距离加权法预测结果都对高值进行了平滑,导致无法对这部分数据进行预测,自然邻域法、径向基函数插值法和样条插值法预测结果中出现牛眼现象,且预测结果以高值-中高值-较高值-低值的同心圆模式分布,样条插值法、反距离加权法、径向基函数插值法和局部多项式插值法的预测精度基本不受尺度的影响,普通克里金插值法和自然邻域法分别在500 m和800 m预测尺度上出现低谷,Cubist插值方法受尺度的影响较大.

(2) Cubist最优模型表明广东省土壤Cd含量空间分布的主要驱动因子是地质类型,以奥陶系、第四系、二叠系、新近纪、石炭系及古近纪为成土母质的土壤Cd含量相对较高.

(3) 广东全省上Cd含量平均值为0.147 mg ·kg-1,低于全国平均值,但其变幅很大.土壤Cd含量小于国家一级标准限制值0.2 mg ·kg-1的面积占广东省总面积的94.96%;超过GB 15618-1995中3级和2级标准,即大于1.0 mg ·kg-1和0.3 mg ·kg-1的面积分别约为160 km2和2 140 km2,分别占全省总面积的0.09%和1.18%.本省土壤Cd含量高值主要分布在珠三角和粤北部分地区,其中Cd含量最高值分布在广州市荔湾区、海珠区和越秀区,Cd含量超过土壤环境质量二级标准值面积最大的是佛山市.

参考文献
[1] Pan J L, Plant J A, Voulvoulis N, et al. Cadmium levels in Europe:implications for human health[J]. Environmental Geochemistry and Health, 2010, 32(1): 1–12. DOI: 10.1007/s10653-009-9273-2
[2] de Livera J, McLaughlin M J, Hettiarachchi G M, et al. Cadmium solubility in paddy soils:effects of soil oxidation, metal sulfides and competitive ions[J]. Science of the Total Environment, 2011, 409(8): 1489–1497. DOI: 10.1016/j.scitotenv.2010.12.028
[3] Zhang H H, Chen J J, Zhu L, et al. Spatial patterns and variation of soil cadmium in Guangdong Province, China[J]. Journal of Geochemical Exploration, 2011, 109(1-3): 86–91. DOI: 10.1016/j.gexplo.2010.10.014
[4] 张小敏, 张秀英, 钟太洋, 等. 中国农田土壤重金属富集状况及其空间分布研究[J]. 环境科学, 2014, 35(2): 692–703. Zhang X M, Zhang X Y, Zhong T Y, et al. Spatial distribution and accumulation of heavy metal in arable land soil of China[J]. Environmental Science, 2014, 35(2): 692–703.
[5] Butt D, Dowling K, Vinden P. Assessment of cadmium distribution in some australian krasnozems by sequential extraction[J]. Water, Air, and Soil Pollution, 2008, 190(1-4): 157–169. DOI: 10.1007/s11270-007-9588-5
[6] Suthar S, Nema A K, Chabukdhara M, et al. Assessment of metals in water and sediments of Hindon River, India:impact of industrial and urban discharges[J]. Journal of Hazardous Materials, 2009, 171(1-3): 1088–1095. DOI: 10.1016/j.jhazmat.2009.06.109
[7] Waalkes M P. Cadmium carcinogenesis in review[J]. Journal of Inorganic Biochemistry, 2000, 79(1-4): 241–244. DOI: 10.1016/S0162-0134(00)00009-X
[8] Wei B G, Yang L S. A review of heavy metal contaminations in urban soils, urban road dusts and agricultural soils from China[J]. Microchemical Journal, 2010, 94(2): 99–107. DOI: 10.1016/j.microc.2009.09.014
[9] Wang H Y, Lu S G. Spatial distribution, source identification and affecting factors of heavy metals contamination in urban-suburban soils of Lishui city, China[J]. Environmental Earth Sciences, 2011, 64(7): 1921–1929. DOI: 10.1007/s12665-011-1005-0
[10] 张金莲, 丁疆峰, 卢桂宁, 等. 广东清远电子垃圾拆解区农田土壤重金属污染评价[J]. 环境科学, 2015, 36(7): 2633–2640. Zhang J L, Ding J F, Lu G N, et al. Heavy metal contamination in farmland soils at an E-waste disassembling site in Qingyuan, Guangdong, South China[J]. Environmental Science, 2015, 36(7): 2633–2640.
[11] 许振成, 杨晓云, 温勇, 等. 北江中上游底泥重金属污染及其潜在生态危害评价[J]. 环境科学, 2009, 30(11): 3262–3268. Xu Z C, Yang X Y, Wen Y, et al. Evaluation of the heavy metals contamination and its potential ecological risk of the sediments in Beijiang River's upper and middle reaches[J]. Environmental Science, 2009, 30(11): 3262–3268. DOI: 10.3321/j.issn:0250-3301.2009.11.022
[12] 付善明, 周永章, 赵宇鴳, 等. 广东大宝山铁多金属矿废水对河流沿岸土壤的重金属污染[J]. 环境科学, 2007, 28(4): 805–812. Fu S M, Zhou Y Z, Zhao Y Y, et al. Study on heavy metals in soils contaminated by acid mine drainage from Dabaoshan mine, Guangdong[J]. Environmental Science, 2007, 28(4): 805–812.
[13] 蔡立梅, 马瑾, 周永章, 等. 东莞市农业土壤重金属的空间分布特征及来源解析[J]. 环境科学, 2008, 29(12): 3496–3502. Cai L M, Ma J, Zhou Y Z, et al. Multivariate geostatistics and GIS-based approach to study the spatial distribution and sources of heavy metals in agricultural soil in the Pearl River Delta, China[J]. Environmental Science, 2008, 29(12): 3496–3502. DOI: 10.3321/j.issn:0250-3301.2008.12.034
[14] Lin Y P, Cheng B Y, Chu H J, et al. Assessing how heavy metal pollution and human activity are related by using logistic regression and kriging methods[J]. Geoderma, 2011, 163(3-4): 275–282. DOI: 10.1016/j.geoderma.2011.05.004
[15] Li J, Heap A D. A review of comparative studies of spatial interpolation methods in environmental sciences:performance and impact factors[J]. Ecological Informatics, 2011, 6(3-4): 228–241. DOI: 10.1016/j.ecoinf.2010.12.003
[16] Eldrandaly K A, Abu-Zaid M S. Comparison of six GIS-based spatial interpolation methods for estimating air temperature in Western Saudi Arabia[J]. Journal of Environmental Informatics, 2011, 18(1): 38–45. DOI: 10.3808/jei.201100197
[17] Lourenço R W, Landim P M B, Rosa A H, et al. Mapping soil pollution by spatial analysis and fuzzy classification[J]. Environmental Earth Sciences, 2010, 60(3): 495–504. DOI: 10.1007/s12665-009-0190-6
[18] Zhao H R, Xia B C, Fan C, et al. Human health risk from soil heavy metal contamination under different land uses near Dabaoshan Mine, Southern China[J]. Science of the Total Environment, 2012, 417.
[19] Pesch R, Schmidt G, Schroeder W, et al. Application of CART in ecological landscape mapping:two case studies[J]. Ecological Indicators, 2011, 11(1): 115–122. DOI: 10.1016/j.ecolind.2009.07.003
[20] Ross C W, Grunwald S, Myers D B. Spatiotemporal modeling of soil organic carbon stocks across a subtropical region[J]. Science of the Total Environment, 2013, 461.
[21] Quinlan J R. Combining instance-based and model-based learning[A]. In:Machine Learning. Machine learning proceedings[C]. San Francisco:Morgan Kaufmann, 1993. 236-243.
[22] 李见賢. 广东省的地貌类型[J]. 中山大学学报 (自然科学版), 1961(4): 70–81.
[23] 郭治兴, 王静, 柴敏, 等. 近30年来广东省土壤pH值的时空变化[J]. 应用生态学报, 2011, 22(2): 425–430. Guo Z X, Wang J, Chai M, et al. Spatiotemporal variation of soil pH in Guangdong Province of China in past 30 years[J]. Chinese Journal of Applied Ecology, 2011, 22(2): 425–430.
[24] Larson C. China gets serious about its pollutant-laden soil[J]. Science, 2014, 343(6178): 1415–1416. DOI: 10.1126/science.343.6178.1415
[25] Bin H, Yun Z J, Shi J B, et al. Research progress of heavy metal pollution in China:sources, analytical methods, status, and toxicity[J]. Chinese Science Bulletin, 2013, 58(2): 134–140. DOI: 10.1007/s11434-012-5541-0
[26] Li J H, Duan H B, Shi P X. Heavy metal contamination of surface soil in electronic waste dismantling area:site investigation and source-apportionment analysis[J]. Waste Management & Research, 2011, 29(7): 727–738.
[27] Zhang X W, Yang L S, Li Y H, et al. Impacts of lead/zinc mining and smelting on the environment and human health in China[J]. Environmental Monitoring and Assessment, 2012, 184(4): 2261–2273. DOI: 10.1007/s10661-011-2115-6
[28] Kuhn M, Johnson K. Applied predictive modeling[M]. New York: Springer, 2013.
[29] Witten I H, Frank E, Hall M A. Data mining:practical machine learning tools and techniques[M]. (2nd ed.). San Francisco, CA, USA: Morgan Kaufmann, 2005: 203-215.
[30] Team R C. The R project for statistical computing[EB/OL]. http://www.R-project.org/, 2014-10-31.
[31] Kuhn M, Johnson K, Keefer C, et al. Cubist:Rule-and Instance-Based Regression Modeling. R package version 0.0.18[Z]. 2014.
[32] Rulequest Research. An overview of cubist[EB/OL]. http://www-ia.hiof.no/~rolando/ML/cubisttutorial.html, 2016.
[33] De Smith M J, Goodchild M F, Longley P. Geospatial analysis:a comprehensive guide to principles, techniques and software tools[M]. (2nd ed.). Leicester: Metador, 2007: 485-488.
[34] Childs C. Interpolating surfaces in ArcGIS spatial analyst[EB/OL]. http://faculty.mu.edu.sa/public/uploads/1338711342.5946interpolating.pdf, 2004-12.
[35] Chinesta F, Cescotto S, Cueto E, et al. Natural element method for the simulation of structures and processes[M]. New York: John Wiley & Sons, 2013: 93-158.
[36] Xie Y F, Chen T B, Lei M, et al. Spatial distribution of soil heavy metal pollution estimated by different interpolation methods:accuracy and uncertainty analysis[J]. Chemosphere, 2011, 82(3): 468–476. DOI: 10.1016/j.chemosphere.2010.09.053
[37] Simard R, L'Ecuyer P. Computing the two-sided kolmogorov-smirnov distribution[J]. Journal of Statistical Software, 2011, 39(11): 1–17.
[38] 赵晓军, 陆泗进, 许人骥, 等. 土壤重金属镉标准值差异比较研究与建议[J]. 环境科学, 2014, 35(4): 1491–1497. Zhao X J, Lu S J, Xu R J, et al. Soil heavy metal cadmium standard limit and range of background value research[J]. Environmental Science, 2014, 35(4): 1491–1497.
[39] Xiao R, Bai J H, Huang L B, et al. Distribution and pollution, toxicity and risk assessment of heavy metals in sediments from urban and rural rivers of the Pearl River delta in southern China[J]. Ecotoxicology, 2013, 22(10): 1564–1575. DOI: 10.1007/s10646-013-1142-1
[40] Wong S C, Li X D, Zhang G, et al. Heavy metals in agricultural soils of the Pearl River Delta, South China[J]. Environmental Pollution, 2002, 119(1): 33–44. DOI: 10.1016/S0269-7491(01)00325-6
[41] Li Z Y, Ma Z W, van der Kuijp T J, et al. A review of soil heavy metal pollution from mines in China:pollution and health risk assessment[J]. Science of The Total Environment, 2014, 468-469: 843–853. DOI: 10.1016/j.scitotenv.2013.08.090
[42] Liu M, Huang B, Bi X H, et al. Heavy metals and organic compounds contamination in soil from an e-waste region in South China[J]. Environmental Science:Processes & Impacts, 2013, 15(5): 919–929.
[43] Wang Z X, Hu X B, Xu Z C, et al. Cadmium in agricultural soils, vegetables and rice and potential health risk in vicinity of Dabaoshan Mine in Shaoguan, China[J]. Journal of Central South University, 2014, 21(5): 2004–2010. DOI: 10.1007/s11771-014-2149-3
[44] Wang X, Wang F H, Chen B, et al. Comparing the health risk of toxic metals through vegetable consumption between industrial polluted and non-polluted fields in Shaoguan, South China[J]. Journal of Food, Agriculture & Environment, 2012, 10(2): 943–948.
[45] 朱永官, 陈保冬, 林爱军, 等. 珠江三角洲地区土壤重金属污染控制与修复研究的若干思考[J]. 环境科学学报, 2005, 25(12): 1575–1579. Zhu Y G, Chen B D, Lin A J, et al. Heavy metal contamination in Pearl River Delta-status and research priorities[J]. Acta Scientiae Circumstantiae, 2005, 25(12): 1575–1579. DOI: 10.3321/j.issn:0253-2468.2005.12.001
[46] Hu Y N, Liu X P, Bai J M, et al. Assessing heavy metal pollution in the surface soils of a region that had undergone three decades of intense industrialization and urbanization[J]. Environmental Science and Pollution Research, 2013, 20(9): 6150–6159. DOI: 10.1007/s11356-013-1668-z
[47] Xia X H, Chen X, Liu R M, et al. Heavy metals in urban soils with various types of land use in Beijing, China[J]. Journal of Hazardous Materials, 2011, 186(2-3): 2043–2050. DOI: 10.1016/j.jhazmat.2010.12.104
[48] Lu Y, Yin W, Zhu F, et al. The spatial distribution and sources of metals in urban soils of Guangzhou, China[A]. In:Proceedings of the 19th World Congress of Soil Science, Soil Solutions for A Changing World. Brisbane, Australia, 2010.
[49] Omstedt G, Bringfelt B, Johansson C. A model for vehicle-induced non-tailpipe emissions of particles along Swedish roads[J]. Atmospheric Environment, 2005, 39(33): 6088–6097. DOI: 10.1016/j.atmosenv.2005.06.037
[50] 冯金飞. 高速公路沿线农田土壤和作物的重金属污染特征及规律[D]. 南京: 南京农业大学, 2010. Feng J F. Characteristics and rules of heavy metal pollution on roadside soil and crop along highway[D]. Nanjing:Nanjing Agricultural University, 2010.
[51] Bäckström M, Nilsson U, Håkansson K, et al. Speciation of heavy metals in road runoff and roadside total deposition[J]. Water, Air, and Soil Pollution, 2003, 147(1-4): 343–366.
[52] Murakami M, Sato N, Anegawa A, et al. Multiple evaluations of the removal of pollutants in road runoff by soil infiltration[J]. Water Research, 2008, 42(10-11): 2745–2755. DOI: 10.1016/j.watres.2008.02.004
[53] 王旭, 杜应琼, 何舞, 等. 粤北矿区重金属污染研究现状与对策[J]. 广东农业科学, 2010, 37(9): 41–43.
[54] 吕文英, 汪玉娟, 李中阳. 北江沉积物中镉的生物可利用性研究[J]. 环境科学与技术, 2011, 34(1): 56–58, 113. Lv W Y, Wang Y J, Li Z Y. Bioavailability and potential ecological risk of Cd in sediment of Beijiang River[J]. Environmental Science & Technology, 2011, 34(1): 56–58, 113.
[55] Wang M, Xu Y J, Pan S X, et al. Long-term heavy metal pollution and mortality in a Chinese population:an ecologic study[J]. Biological Trace Element Research, 2011, 142(3): 362–379. DOI: 10.1007/s12011-010-8802-2
[56] Jovanovic V P S, Ilic M D, Markovic M S, et al. Wild fire impact on copper, zinc, lead and cadmium distribution in soil and relation with abundance in selected plants of Lamiaceae family from Vidlic Mountain (Serbia)[J]. Chemosphere, 2011, 84(11): 1584–1591. DOI: 10.1016/j.chemosphere.2011.05.048
[57] de Vries W, Groenenberg J E, Lofts S, et al. Critical loads of heavy metals for soils[A]. In:Alloway B J. Heavy Metals in Soils:Trace Metals and Metalloids in Soils and their Bioavailability[M]. Dordrecht:Springer, 2013. 211-237.
[58] Houben D, Evrard L, Sonnet P. Mobility, bioavailability and pH-dependent leaching of cadmium, zinc and lead in a contaminated soil amended with biochar[J]. Chemosphere, 2013, 92(11): 1450–1457. DOI: 10.1016/j.chemosphere.2013.03.055
[59] Morais S, E-Costa F G, de Lourdes Pereira M. Heavy metals and human health[M]. Rijeka, Croatia: InTech Open Access Publisher, 2012.
[60] Sayadi M H, Sayyed M R G. Comparative assessment of baseline concentration of the heavy metals in the soils of Tehran (Iran) with the comprisable reference data[J]. Environmental Earth Sciences, 2011, 63(6): 1179–1188. DOI: 10.1007/s12665-010-0792-z
[61] Wuana R A, Okieimen F E. Heavy metals in contaminated soils:a review of sources, chemistry, risks and best available strategies for remediation[J]. ISRN Ecology, 2011, 2011: 402647.
[62] 周建军, 周桔, 冯仁国. 我国土壤重金属污染现状及治理战略[J]. 中国科学院院刊, 2014, 29(3): 315–320. Zhou J J, Zhou J, Feng R G. Status of China's heavy metal contamination in soil and its remediation strategy[J]. Bulletin of Chinese Academy of Sciences, 2014, 29(3): 315–320.
[63] Wu G H, Yang C C, Guo L, et al. Cadmium contamination in Tianjin agricultural soils and sediments:relative importance of atmospheric deposition from coal combustion[J]. Environmental Geochemistry and Health, 2013, 35(3): 405–416. DOI: 10.1007/s10653-012-9503-x
[64] 窦磊, 杜海燕, 游远航, 等. 珠江三角洲经济区生态地球化学评价[J]. 现代地质, 2014, 28(5): 915–927. Dou L, Du H Y, You Y H, et al. Eco-geochemical survey and assessment in Pearl River Delta economic zone, Guangdong Province, China[J]. Geoscience, 2014, 28(5): 915–927.