2. 宁夏大学生态环境学院, 银川 750021;
3. 宁夏大学科学技术研究院, 银川 750021;
4. 宁夏回族自治区农业环境保护监测站, 银川 750002
2. College of Ecology and Environment, Ningxia University, Yinchuan 750021, China;
3. Research Institute of Science and Technology, Ningxia University, Yinchuan 750021, China;
4. Agricultural Environmental Protection Monitoring Station of Ningxia Hui Autonomous Region, Yinchuan 750002, China
阳离子交换量(cation exchange capacity, CEC)指土壤表面可容纳正电荷离子的负电荷位点数量[1], 能反映土壤保肥性、缓冲性和环境容量, 是表征土壤肥力和环境质量的重要指标[2], 在土壤污染调查中属必测指标[3], 可作为风化指标用于评估土壤年龄[4]. 实验室测定土壤CEC最准确的方法为湿化学法[5], 所测结果虽然准确但测试步骤繁琐、耗材昂贵且费时费力[6]. 因此, 发掘快速准确的土壤CEC获取方法, 对土壤质量监测来说意义重大.
土壤连续传递函数法(soil pedo-transfer functions, PTFs)是一种采用易获取土壤粒径、pH和有机质含量等参数来预测难于测定的CEC等土壤水力特性参数的间接方法[1], PTFs传递函数模型由早期的线性回归、非线性回归延伸到现在的神经网络模型. 如Enang等[6]通过PTFs构建了喀麦隆西北地区土壤CEC非线性回归预测模型, 发现分土层构建土壤传递函数可提高模型精度;Shabani等[7]运用多元回归拟合土壤参数预测土壤CEC值, 并结合当地土壤特征分析提高了模型拟合效果;Olorunfemi等[8]利用5个线性回归模型对尼日利亚森林带土壤CEC进行了预测, 筛选出了最佳预测模型方程式, 为该地区土壤CEC获取提供了可靠的方法. 尽管线性回归法实现了土壤CEC的估测, 但由于输入和输出数据间的非线性关系影响模型的精度[9]. 因此, 以聚类、决策树和神经网络等为主的机器学习法成为众多学者预测土壤CEC的新手段[10~12]. 如Saidi等[13]预测土壤CEC值时采用随机森林、k最近邻、立体模型和支持向量机等机器学习方法, 且发现随机森林预测结果最佳;Mishra等[12]对比了支持向量机和随机森林在不同土壤中的预测效果, 同样发现随机森林法能更准确地预测土壤CEC, 且验证准确率达67%, 特别是休耕地和草地等, 而支持向量机在农业种植园土壤CEC预测中较好;Ng等[14]使用深度卷积神经网络学习法结合光谱参数预测土壤CEC时发现, 不经过预处理的光谱数据预测性能更高. 由此可见, 机器学习法在土壤CEC预测中得到了大量应用[9, 15], 但相关预测缺乏算法优化和优化模型对比.
基于此, 本研究以宁夏各地农田0~20 cm耕层土壤为对象, 分析土壤CEC空间分布特征, 选用土壤理化参数(pH、有机碳和机械组成), 构建基于多元线性回归、反向传播神经网络和卷积神经网络的土壤CEC预测模型, 分析各模型的预测精度, 并且通过粒子群优化算法与灰狼优化算法优化后共建立6种神经网络模型. 最后依据模型评价指标对所构建模型预测精度进行比较, 筛选出宁夏农田土壤CEC最优预测模型, 以期为宁夏农田土壤CEC预测提供新的解决方案.
1 材料与方法 1.1 研究区土地概况本研究土壤样品采自于宁夏回族自治区(104°17'~107°39'E、35°14'~39°23'N, 图 1)不同土地利用类型农田. 宁夏位于中国西部黄河上游地区, 土地资源丰富, 土壤类型众多, 从北至南依次为贺兰山山地、黄河冲积平原、鄂尔多斯高原、同心山间盆地、黄土高原和六盘山地, 总面积6.64×104 km2 [16, 17].
![]() |
图 1 采样点分布示意 Fig. 1 Sampling sites distribution |
采用“易测宝”GPS测定采样点地理坐标, 按网格法布点, 采样时根据当地地形特征和周边环境等实际情况优化与增减点位位置, 确保所有采样点位于农田内. 土壤采集于2020~2022年分3批完成, 采样时在点位中心周围100 m范围内随机采集5个样点0~20 cm土壤, 充分混匀后采用“四分法”取约1 kg土壤样品, 密封保存, 共采集土壤样品565个. 将土样自然风干后, 去除杂物, 每个样品分为2部分, 一部分粉碎与研磨且过1 mm和0.25 mm筛, 用于测定土壤pH、有机质(OM)和CEC;另一部分粉碎研磨后过2 mm筛, 用于测定土壤砂粒(Sa)、粉粒(Si)和黏粒(Cl)的质量分数[18], 具体测定方法见表 1.
![]() |
表 1 土壤样品测定方法 Table 1 Methods of determination of soil samples |
1.3 土壤类型划分及空间分布
565个土壤样本的土壤质地类型划分结果和空间分布如图 2所示, 其中:粉壤土(n=220)、粉砂质黏壤土(n=122)、壤土(n=94)、砂壤土(n=49)、黏土(n=30)、黏壤土(n=22)、壤砂土(n=8)、粉土(n=6)、粉砂质黏土(n=5)、砂土(n=5)和砂质黏壤土(n=4), 在所采的土壤样品中未发现砂黏土. 所有土样中有粉壤土、粉砂质黏壤土、壤土、砂壤土、黏土和黏壤土这6类土壤样本数超过20, 足够用于建模和验证.
![]() |
图 2 土壤类型划分及空间分布 Fig. 2 Soil texture type classification and spatial distribution map |
多元线性回归(multiple linear regression, MLR)是一种简单易用、可解释性强的线性回归模型, 其表达式为:
![]() |
(1) |
式中, Y为因变量;β0为常数项;Xi (i=1, 2, 3, …, n)为自变量;βi (i=1, 2, 3, …, n)为自变量对应的系数;ε为误差项, ε~N(0, σ2).
1.4.2 神经网络(1)反向传播神经网络(back propagation neural network, BP)是一种按误差逆传播且训练的多层前馈网络算法[22]. 利用梯度搜索技术, 使实际输出值和期望输出值的误差均方差为最小. 基本参数包括网络层数、隐含层层数、最大训练步数、网络学习步长和速率等[23], 本研究中输入层设置5个神经元, 隐含层神经元个数为15个, 输出层神经元个数为1个, 网络模型学习率为0.01, 迭代次数为1 000次.
(2)卷积神经网络(convolutional neural networks, CNN)是深度学习经典算法之一[24], 具有局部连接、权值共享等特征, 可将原始数据进行高维映射处理, 从而有效提取数据特征. 包含卷积层、池化层和全连接层等. 本研究中批量大小为32, 迭代次数设定为400次, 初始学习率为0.01, 经过800次训练后, 学习率为0.01×0.1. 本文构建的卷积神经网络主要由1个输入层, 2个隐藏层和1个输出层构成, Dropout层为0.1.
1.4.3 优化算法(1)粒子群优化算法(particle swarm optimization, PSO)的思想源于对鸟群觅食行为的研究, 其基本原理为:首先随机给定所有粒子初始位置和速度, 再依据粒子已知的最优位置逼近问题空间中已知的最优全局位置, 通过不断迭代来获得全局最优结果, 工作流程见图 3.
![]() |
图 3 粒子群优化算法流程 Fig. 3 Particle swarm optimization algorithm process |
求解过程中每个粒子的速度和位置由自身的最佳过去位置和整个群体或近邻的最佳过去位置决定[25, 26]. 表达式为:
![]() |
(2) |
式中, vij(t)为粒子在t时刻的速度向量;xij(t)为粒子在t时刻的位置向量;vij(t+1)为粒子在t+1时刻的速度向量;xij(t+1)为粒子在t+1时刻的位置向量;pij(t)为t时刻个体的最优位置;g(t)为t时刻群体的最优位置;w为最佳惯性权重;i=1, 2, 3, …, n;j=1, 2, 3, …, D;D为被优化参数的个数;c1和c2为学习因子, 取c1=c2=2;r1和r2为两个随机函数, 取值范围[0, 1], 用于增加搜索随机性. 为防止粒子的盲目搜索, 将粒子位置(x)限制在[-1, 1], 粒子速度(v)限制在[-1, 1].
(2)灰狼优化算法(grey wolf optimizer, GWO)是模拟自然界中狼群等级制度下集体狩猎的群体智能优化算法[27]. 该算法通过4种类型的狼(α、β、γ和ω)来模拟社会等级, α狼在狼群中为最高等级, 负责寻优与过程决策, 因此α为最优解, β和γ狼的位置分别作为优解和次优解, ω狼的位置作为其余的候选解. 狩猎过程中, 由a, β和γ狼引导搜索(优化), ω狼跟随前面3种狼, 通过狼群跟踪、包围、追捕和攻击猎物4个过程来实现优化搜索目的[28].
包围猎物过程, 数学模型[29]可以表示为:
![]() |
(3) |
![]() |
(4) |
式中, Px为猎物位置向量;P为灰狼位置向量;D为灰狼与猎物间的距离向量;t为迭代次数. 向量系数C和Z的计算公式中, l1与l2为模在[0, 1]内的随机向量, z为收敛因子.
狩猎过程通常由α、β和γ狼引导, ω狼根据前3个等级狼的位置更新位置靠近猎物. 其数学模型为:
![]() |
(5) |
![]() |
(6) |
![]() |
(7) |
式中, Dα、Dβ和Dγ为候选解与3个优解间的距离;P1、P2和P3为候选解相对3个优解的位置更新向量;Xω为更新后的候选解位置;C1、C2、C3、Z1、Z2和Z3为向量系数.
攻击猎物过程中, 狼群通过更新(α、β和γ)3个等级的狼的位置寻找最优猎物位置. 为模拟狼群逼近猎物, z随着迭代次数从2线性减少到0. 当|Z|≤1时, 算法收敛, 获得猎物位置, 工作流程见图 4.
![]() |
图 4 灰狼优化算法流程 Fig. 4 Grey wolf optimization algorithm process |
本研究从565个土壤样本中随机选取70%(396个)作为训练集, 其余30%(169个)作为验证集, 通过比较土壤样本CEC预测值与实测值的决定系数(R-square, R2)、平均绝对误差(mean absolute error, MAE)、均方根误差(root mean square error, RMSE)和标准均方根误差(normalized root mean squared error, NRMSE)评价模型性能. 计算公式如下:
![]() |
(8) |
![]() |
(9) |
![]() |
(10) |
![]() |
(11) |
式中, CECm为实测值, CECe为模型估计值, CECm为实测数据的平均值, n为样本数量. 较小的RMSE值表明预测值和实测值之间的一致性较好, 参照Jamieson等[30]提出的标准来衡量模型稳定性:NRMSE < 10%, 模型稳定性极好;10%≤NRMSE < 20%, 模型稳定性较好;20%≤NRMSE < 30%, 模型稳定性一般;NRMSE > 30%, 模型稳定性较差. 因此最好的模型是NRMSE和RMSE值均较小的模型.
此外, 为了比较不同模型方法预测土壤CEC的一致性和准确性, 采用林氏一致性相关系数(concordance correlation coefficient, CCC)进行评价.
![]() |
(12) |
式中, σm为测量值方差, σe为预测值方差, μm为平均测量值(cmol·kg-1), μe为平均预测值(cmol·kg-1), ρ为Pearson相关系数. 根据CCC指标, 模型的性能可以分为:CCC≥0.9, 一致性极好;0.8≤CCC < 0.9, 一致性较好;0.65 < CCC≤0.8, 一致性适中;CCC≤0.65, 一致性较差.
2 结果与分析 2.1 宁夏农田土壤基本参数统计分析及空间分布特征 2.1.1 土壤基本参数统计分析由表 1统计结果显示, 565个样点土壤CEC最小值为2.57 cmol·kg-1, 最大值为27.40 cmol·kg-1, 变异系数为40.74%, 属于高变异, 数据分布表现为右偏和尖峰(S=1.83, K=4.63);pH值处于7.30~9.40范围内, 变异系数为3.46%, 这说明宁夏农田土壤均偏碱性, 且处于低变异水平;ω(OC)平均值为0.84%, 为高变异(CV=45.32%), 数据分布表现为右偏和尖峰(S=1.31, K=4.76), 其中土壤OC含量最高的土壤样本来自于宁夏中部的吴忠市青铜峡瞿靖镇友好村;所有采样点土壤颗粒含量中, Cl平均值最低(23.87%), Si平均值最高(49.72%), Sa变异程度最高(CV=72.83%), 说明宁夏农田土壤整体偏粉质, 且部分地区土壤砂质化严重, 数据分布方面, Sa分布右偏, Si分布左偏, 两者均相对平顶, Cl数据分布表现为右偏和尖峰(S=1.46, K=4.33).
![]() |
表 1 所调查样品土壤性质描述性统计1) Table 1 Descriptive statistics of soil properties for investigated samples |
2.1.2 土壤基本理化参数空间分布特征
利用克里金插值法形成宁夏土壤基本理化参数空间分布(见图 5). 土壤CEC、OC、Si和Cl空间分布特征相似, 具体表现为黄河(宁夏段)周边及降水集中的宁南山区较高, 宁夏中部干旱带和中东部地区较低, 而pH值和Sa含量空间分布情况与CEC值恰好相反, 高值区出现在宁夏中部干旱带和中东部地区, 同时贺兰山一带也存在高值响应.
![]() |
图 5 土壤基本理化参数空间插值分布 Fig. 5 Spatially interpolated distribution of basic soil physical and chemical parameters |
宁夏及各市区数据集中研究变量的Pearson分析结果如图 6所示. 土壤CEC与pH呈极显著负相关, 相关系数(r)在-0.27~-0.50之间, 与OC呈显著正相关, 且除石嘴山市达显著水平(P < 0.05)外, 其余数据集中土壤CEC与OC均达极显著水平(P < 0.01). 土壤质地数据集方面, 表现为土壤CEC与Cl正相关、与Sa负相关, 其中Cl的相关系数在0.66~0.77之间, Sa的相关系数在-0.12~-0.55之间, Si除石嘴山市和固原市对CEC存在显著负影响外, 其余数据集中与CEC均存在较弱的正相关性, 相关系数处于0.01~0.21之间.
![]() |
(a)宁夏(总), (b)石嘴山市, (c)银川市, (d)吴忠市, (e)中卫市, (f)固原市;*和**分别表示差异达显著(P < 0.05)和极显著(P < 0.01)水平;色柱颜色:黄(蓝)色越深, 二者间正(负)相关性越强, 下同 图 6 宁夏及其各市区农田土壤基本特性的Pearson相关分析 Fig. 6 Pearson correlation analysis of basic characteristics of farmland soils in Ningxia and its municipalities |
所划分的土壤类型中, 样本数量足够用于模型构建的6种土壤质地类型研究变量间的Pearson相关结果如图 7所示. 与总数据集相同, 各类型土壤中, CEC受到pH的负影响(r < -0.02)和OC的正向影响(r > 0.36);土壤质地方面, CEC与Cl呈正相关关系, 且仅粉壤土和壤土达显著水平(P < 0.05), 而除粉砂质黏壤土和壤土外, CEC受到Sa的负影响(r < -0.13)和Si的正向影响(r > 0.07).
![]() |
(a)粉壤土, (b)粉砂质黏壤土, (c)壤土, (d)砂壤土, (e)黏土, (f)黏壤土 图 7 各类型土壤基本特性的Pearson相关分析 Fig. 7 Pearson correlation analysis of basic characteristics of various soil types |
对各数据集的5项建模指标进行共线性诊断, 并选用方差膨胀因子(VIF)来判断各指标间的共线性强弱. 各数据集中pH、OC、Cl和Si等4项指标的VIF值均小于3(表 2), 说明这4项指标间共线性较低, 对建模型影响较弱. 而Sa的VIF值均为无穷大, 说明与其他指标间趋近于完全共线, 因此, 构建多元线性回归模型时剔除Sa这一指标.
![]() |
表 2 多重共线性检验结果(VIF值)1) Table 2 Multicollinearity test results |
选用pH、OC、Cl和Si等4项指标进行多元线性回归拟合, 构建MLR模型. 由表 3可知, 采用总数据集构建的MLR模型R2为0.64、RMSE为2.33 cmol·kg-1, 自变量能解释土壤CEC变异性达64%, 平均误差较小, 拟合效果较优. 总数据集按市区划分后所构建的MLR模型中, 石嘴山市模型(R2=0.61, RMSE=2.52 cmol·kg-1), 银川市模型(R2=0.57, RMSE=2.88 cmol·kg-1), 拟合效果均有降低, 平均误差增大, 其他3个市区对应的MLR模型R2 > 0.64, RMSE < 2.33 cmol·kg-1, 拟合精度均高于总数据集模型, 这说明石嘴山市和银川市农田土壤CEC变异程度较高, 仅用4项指标进行预测较为困难. 总数据集按土壤质地类型划分后所构建的6个MLR模型中, 除砂壤土模型R2 > 0.64外, 其余模型拟合效果均不及总数据集模型, 但除黏土模型外其余的5个模型的RMSE均小于总数据集模型, 说明将总数据集按照土壤质地类型划分后, 模型平均误差虽有所减小, 但模型预测精度大幅降低. 由此可见, 按市区对总数据集进行划分, 构建小范围区域内的MLR模型更有利于农田土壤CEC预测.
![]() |
表 3 土壤CEC多元线性回归预测模型 Table 3 Soil CEC multiple linear regression prediction model |
2.3.2 神经网络模型构建
本研究选用BP、CNN、PSO-BP、PSO-CNN、GWO-BP和GWO-CNN这6种神经网络法进行土壤CEC预测. 从模型选择角度来看, BP与其优化网络模型(PSO-BP和GWO-BP)的R2≤0.77, RMSE≥1.85 cmol·kg-1, 而CNN与其优化网络模型(PSO-CNN和GWO-CNN)的R2≥0.84, RMSE≤1.57 cmol·kg-1, 说明CNN学习效果优于BP, 更适合土壤CEC的估测;从算法选择的角度来看, PSO算法和GWO算法优化后的神经网络模型对土壤CEC的解释力度均增强, 平均误差均减小(表 4), 且GWO算法优化后的神经网络学习效果更强.
![]() |
表 4 土壤CEC神经网络估测模型 Table 4 Soil CEC neural network estimation model |
由于两种算法优化后的模型预测结果差异较小, 因此选用R2、r、MAE、RMSE、NRMSE和CCC对比模型的稳定性和预测结果的准确性. 总体来看, BP模型各项精度指标最差, 而PSO-BP和GWO-BP预测精度较BP模型有所提升, 但相差不大. CNN模型预测精度高于以上3种模型, 但低于优化后的CNN模型(PSO-CNN和GWO-CNN), 说明CNN神经网络能够提取输入数据的关键特征, 进而提高预测精度. 不同模型MAE、RMSE和NRMSE大小排序均为:BP > PSO-BP > GWO-BP > CNN > PSO-CNN > GWO-CNN;R2和r排序依次为:GWO-CNN > PSO-CNN > CNN > GWO-BP > PSO-BP > BP, 以MLR为参照, BP、CNN、PSO-BP、PSO-CNN、GWO-BP和GWO-CNN预测精度(R2)分别提高了13.59%、30.78%、18.91%、35.47%、20.94%和38.91%;说明这6种神经网络模型中GWO-CNN模型稳定性最好, 预测精度最高. 从林氏一致性相关系数(CCC)来看, 实测值和预测值一致性最高为PSO-CNN模型. 同时, PSO-BP模型预测结果的一致性也高于GWO-BP, 这说明PSO算法优化的神经网络模型对极端值的预测效果要优于GWO算法优化的神经网络模型.
2.4 土壤CEC预测结果对比从7种模型(1种多元回归和6种神经网络)预测结果与实测值对比发现, 7种模型的实测值中, 高值区均有不同程度的压缩, MLR、CNN和PSO-BP这3个模型低值区存在过拟合现象(图 8). 相比之下, PSO-CNN模型的预测值最接近实测值, 说明PSO算法可以增强神经网络对高值和低值的预测精度, 但由表 4分析所知, GWO-CNN模型拟合效果和预测精度均为最佳, 因此可以发现PSO-CNN模型对中间值预测精度不及GWO-CNN模型.
![]() |
1.实测结果, 2.MLR模型预测结果, 3.BP模型预测结果, 4.CNN模型预测结果, 5.PSO-BP模型预测结果, 6.PSO-CNN模型预测结果, 7.GWO-CNN模型预测结果, 8.GWO-CNN模型预测结果 图 8 不同模型土壤CEC预测结果与实测结果对比 Fig. 8 Comparison of predicted and measured soil CEC results from different models |
在7种模型预测结果基础上, 利用克里金插值法形成宁夏农田土壤CEC的空间分布情况(图 9). 整体看来, 7种方法的CEC预测结果与实测结果空间分布基本一致, 呈现出宁夏北部和南部高, 中部低的趋势. 而相较于多元线性回归方法得到的结果, 机器学习方法预测的土壤CEC空间分布高、低值区更为明显.
![]() |
图 9 不同模型土壤CEC预测结果与实测结果的空间分布 Fig. 9 Spatial distribution of predicted and measured soil CEC results from different models |
为进一步确定模型的精确度和适用性, 选取训练集R2 > 0.7的6个模型(BP、CNN、PSO-BP、PSO-CNN、GWO-BP和GWO-CNN), 利用剩余30%(n=169)样本数据进行模型验证, 对验证集的土壤CEC实测值和各模型预测值进行线性拟合如图 10所示. 6个模型的验证集R2≥0.81, RMSE≤1.60 cmol·kg-1, NRMSE≤17.37%, 其中, 基于GWO算法优化的CNN模型表现依旧最佳, R2为0.91, RMSE为1.07 cmol·kg-1, NRMSE为11.77%, 模型接近极稳定水平.
![]() |
图中RMSE单位均为cmol·kg-1 图 10 神经网络模型验证 Fig. 10 Neural network model validation |
阳离子交换量(CEC)能够表征土壤养分供应能力和肥力水平, 对于合理施肥和土壤管理具有重要的指导意义[33]. 本研究通过对宁夏565个农田耕层土壤样本CEC进行分析发现, 宁夏农田土壤肥力水平较低, CEC在2.57~27.40 cmol·kg-1之间, 为高变异(CV=40.74%). 究其原因, 本研究区处于中国西北内陆腹地, 受自然环境影响, 当地农田土壤肥力水平较低;另一方面, 宁夏是中国优质高档绿色蔬菜和冷凉高产蔬菜产区, 农事操作使得外源性有机肥施入量不足, 导致当地土壤肥力偏低. 此外, 宁夏横跨暖温带、中温带及高寒带, 气候复杂且多样, 各县区农田土壤母质及耕作制度差异较大, 导致农田土壤CEC在空间上呈现出高度变异性.
通过分析宁夏农田土壤CEC空间分布情况发现, 黄河(宁夏段)周边及降水集中的南部山区土壤CEC较高, 中部干旱带和中东部地区土壤CEC较低, 这说明土壤CEC受土壤水分影响显著, Arthur等[34]也发现了类似情况, 分析原因主要是土壤在吸水过程中, 水分子首先聚集在阳离子或交换位点周围, 然后在颗粒表面形成层, 因此, 吸收的水的质量与交换性阳离子含量成正比, 并由此延伸到CEC[35]. 此外, 宁夏中部干旱带和中东部地区农田土壤CEC分布出现大面积低值区, 这可能是受取样点数量影响(图 1). 由于该地区属于山区, 农田面积小且较为分散, 因此取样点布设较少, 采用克里金插值法时稀疏的栅格单元导致误差增大, 出现大范围的低值区.
3.2 土壤基本理化性质相关性解析由土壤基本理化性质指标空间插值分布可以发现(图 5), 土壤CEC与其基本理化性质间关系密切. 前人研究结果表明, 土壤CEC与土壤有机质含量存在极显著正相关[36], 与土壤pH存在显著负相关[37];在土壤颗粒组成中, 土壤CEC与土壤黏粒和粉粒间呈正相关, 与砂粒呈负相关, 即在有机质、黏粒和粉粒含量高的地方, CEC相对充足[38], 这与本研究结果一致[图 6(a)]. 究其原因是土壤CEC的大小取决于土壤胶体的比表面积和表面负电荷密度, 而土壤有机质中的腐殖质具有较大的比表面积, 可水解大量的负电荷官能团聚集在腐殖质表面[39], 因此土壤CEC与土壤OM间存在极显著正相关性;在土壤颗粒组成中, 黏粒胶体集中了80%以上的负电荷, 且土壤黏粒和粉粒的比表面积和表面电荷较大[40], 因此土壤黏粒和粉粒含量越高, CEC就越高[41], 而砂粒颗粒较粗, 主要是由原生矿物质组成, 表面积较小, 吸附交换点少, 因此砂粒与其表面电荷数量和比表面积呈负相关, 进而延伸到CEC[42];此外土壤pH的降低会改变植物根际电荷性质, 引起土壤CEC升高[43]. 整体分析而言, 本研究中5个自变量对土壤CEC的影响程度不同, 构建土壤CEC模型是合理的.
3.3 土壤CEC模型预测能力对比对于土壤CEC的空间分布预测, 不同预测方法存在着不同的优势与缺陷[44]. 本研究中6种神经网络模型(BP、CNN、PSO-BP、PSO-CNN、GWO-BP和GWO-CNN)与MLR模型相比, MLR预测土壤CEC空间分布精度整体偏低, 主要是由于部分变量间存在多重共线性, 建模前剔除了Sa变量, 导致模型的整体解释力度下降;另一方面可能是由于MLR模型只能捕捉变量之间的线性关系, 侧重于对重点变量系数估计的准确性, 对于变量遗漏的内生性问题无法直接检验, 导致模型预测效果受限[45]. 此外, 本研究按照宁夏行政市区和土壤质地类型对总数据集划分后, 进行了MLR拟合结果表明, 按照行政市区划分总数据集模型拟合效果优于按照土壤质地类型划分总数据集. 这是由于划分土壤质地类型, 仅能减小土壤在机械组成(物理性质)方面的差异性, 对CEC和OC等化学性质影响较小;而按行政市区划分后, 由于研究范围缩小, 气候变化、母质类型和耕作方式所引起的土壤理化性质差异均有所降低(图 5), 因此构建小范围区域的MLR模型更有利于农田土壤CEC估测.
从本研究可以看出, 与MLR线性模型相比, 6个神经网络模型表现出了独特的优势(表 3和表 4). 一方面神经网络模型中的所有输入数据均进行了归一化处理, 输入数据均处于相同层次, 消除了矢量量纲及双尾影响, 从而避免了因输入数据的数量级差异而造成的误差, 保证了预测的准确性[46];另一方面, 6个神经网络模型能够刻画土壤CEC与土壤理化性质间的非线性关系, 更切合实际, 且在数据稀少的区域具有很大的预测优势[47]. 在本研究中选用CNN神经网络和BP神经网络, 借助PSO算法和GWO算法对2种神经网络模型进行优化, 共得到6种神经网络模型. 通过对比发现, CNN神经网络的学习效果优于BP神经网络, 主要是因为CNN属于深度学习模型, 而BP神经网络是一种浅层机器学习模型, 两者之间最大的区别在于CNN包含多个隐层, 各隐层逐步实现对输入数据的特征变换, 从而使回归预测更加精准[48];其次, BP神经网络是一种监督学习机制, 收敛速度慢、出现局部极小值等缺陷, 而CNN神经网络是一种非监督学习机制, 先逐层训练网络, 再进行调优, 使原始输入向上生成的高级特征与向下生成的图像表示尽可能一致[48], 提高了预测精度. 从优化算法角度来看, 本研究结果显示, PSO算法和GWO算法优化后的神经网络模型对土壤CEC的预测精度显著提高, 平均误差相对减小(表 4), 且GWO算法优化后的神经网络学习效果更强, 这与吴艳娟等[49]研究结果一致. 分析原因, 主要是由于GWO算法通过引入不同社会等级的头狼共同决策, 求解的多样性增加, 导致GWO算法在求解效果方面优于PSO算法[50].
本研究比较分析了6种神经网络模型的R2、r、MAE、RMSE和NRMSE等精度评价参数发现, GWO-CNN模型稳定性最好, 模型预测精度最高, 但林氏一致性相关系数CCC表现为PSO-CNN高于GWO-CNN(表 4). 结合两种算法的特点和图 8预测结果可知, PSO算法较强的全局搜索能力使PSO-CNN模型对极端值的预测能力强于GWO-CNN模型, 而GWO算法能够避免局部最优, 使GWO-CNN模型中间值的预测精度高于PSO-CNN, 这可能是PSO-CNN的CCC高于GWO-CNN的主要原因. GWO-CNN模型预测精度高, 外推能力强, 但模型仍需大量训练, 调节优化参数才能取得更好的预测结果.
4 结论(1)宁夏行政区划下农田土壤CEC平均值为9.39 cmol·kg-1, 其范围在2.57~27.40 cmol·kg-1之间, 变异系数为40.74%, 总体空间分布特征为黄河(宁夏段)周边及宁南山区较高, 中部干旱带和中东部地区较低.
(2)对565个土样基本理化参数相关性分析显示, 土壤CEC与OC和Cl呈极显著正相关, 与pH和Sa呈极显著负相关, 而Si与CEC相关性未达显著水平(P < 0.05), 说明土壤OC、Cl、pH和Sa是影响宁夏农田土壤CEC的重要因素, 其相关系数分别为0.55、0.72、-0.41和-0.44;按照市区和土壤质地类型划分数据集后, 各数据集中CEC与pH、OC和Cl间的相关性与总数据集保持一致, 而CEC与Sa和Si在不同数据集中的相关性并不相同.
(3)总数据集构建的MLR模型其自变量能解释土壤CEC变异性的64%, 以该模型预测精度(R2)为标准, 对比分析两种土壤数据集划分方式(行政市区和土壤质地类型)的优劣, 按照行政市区划分数据集, 构建MLR模型共5个, 其中3个模型的预测精度高于标准, 其他2个模型的R2均大于0.57, 预测精度高;按照土壤质地类型划分数据集, 构建MLR模型共6个, 其中仅砂壤土模型R2为0.66, 预测精度高于标准值, 其余5个模型的R2均小于0.45, 预测精度较差. 由此说明按市区对总数据集进行划分, 构建市区范围内的MLR模型更有利于农田土壤CEC预测.
(4)对比本研究中7个总数据集模型(1个MLR模型和6个神经网络模型)的预测精度(R2)发现, 与MLR模型相比, 神经网络模型展现出了良好的预测效果. 以MLR为参照, BP、CNN、PSO-BP、PSO-CNN、GWO-BP和GWO-CNN的R2分别提高了13.59%、30.78%、18.91%、35.47%、20.94%和38.91%. 对7个模型的预测结果进行分析发现, PSO-CNN模型对极端值的预测精度较高, 但对中间值预测精度不及GWO-CNN模型. 说明, GWO-CNN模型能更准确有效地预测宁夏农田土壤CEC的空间分布.
(5)模型验证结果显示, GWO-CNN模型验证集R2为0.91, RMSE为1.07 cmol·kg-1, NRMSE为11.77%, 模型接近极稳定水平, 综合预测能力最佳. 因此, 基于灰狼算法优化的卷积神经网络模型预测精度高, 外推能力强, 是本研究尺度下土壤CEC预测的最佳模型. 此研究结果可以为宁夏农田土壤CEC预测提供新的思路和解决方案.
[1] | Khaledian Y, Brevik E C, Pereira P, et al. Modeling soil cation exchange capacity in multiple countries[J]. CATENA, 2017, 158: 194-200. DOI:10.1016/j.catena.2017.07.002 |
[2] |
周碧青, 邱龙霞, 张黎明, 等. 基于灰色关联-结构方程模型的土壤酸化驱动因子研究[J]. 土壤学报, 2018, 55(5): 1233-1242. Zhou B Q, Qiu L X, Zhang L M, et al. Study on driving factors of soil acidification based on grey correlation-structure equation model[J]. Acta Pedologica Sinica, 2018, 55(5): 1233-1242. |
[3] |
陈勇, 邹献中, 卢瑛, 等. 磁力搅拌法改进土壤阳离子交换量测定的研究[J]. 土壤学报, 2020, 57(2): 508-514. Chen Y, Zou X Z, Lu Y, et al. Study on improving soil CEC determination by magnetic stirring method[J]. Acta Pedologica Sinica, 2020, 57(2): 508-514. |
[4] | Miller W F. Inter-regional predictability of cation-exchange capacity by multiple regression[J]. Plant and Soil, 1970, 33(1-3): 721-725. DOI:10.1007/BF01378263 |
[5] | Zolfaghari A A, Taghizadeh-Mehrjardi R, Moshki A R, et al. Using the nonparametric k-nearest neighbor approach for predicting cation exchange capacity[J]. Geoderma, 2016, 265: 111-119. DOI:10.1016/j.geoderma.2015.11.012 |
[6] | Enang R K, Kips P A, Yerima B P K, et al. Pedotransfer functions for cation exchange capacity estimation in highly weathered soils of the tropical highlands of NW Cameroon[J]. Geoderma Regional, 2022, 29. DOI:10.1016/j.geodrs.2022.e00514 |
[7] | Shabani A, Norouzi M. Predicting cation exchange capacity by artificial neural network and multiple linear regression using terrain and soil characteristics[J]. Indian Journal of Science and Technology, 2015. DOI:10.17485/ijst/2015/v8i28/83328 |
[8] | Olorunfemi I E, Fasinmirin J T, Ojo A S. Modeling cation exchange capacity and soil water holding capacity from basic soil properties[J]. Eurasian Journal of Soil Science, 2016, 5(4): 266-274. |
[9] | Emamgholizadeh S, Bazoobandi A, Mohammadi B, et al. Prediction of soil cation exchange capacity using enhanced machine learning approaches in the southern region of the Caspian Sea[J]. Ain Shams Engineering Journal, 2023, 14(2). DOI:10.1016/j.asej.2022.101876 |
[10] | Huang Y Y, Molavi Nojumi M, Ansari S, et al. Evaluating the use of machine learning for moisture content prediction in base and subgrade layers[J]. Road Materials and Pavement Design, 2023, 24(12): 2910-2928. DOI:10.1080/14680629.2023.2182135 |
[11] | Sridevy S, Raj M N, Kumaresan P, et al. Mapping of soil properties using machine learning techniques[J]. International Journal of Environment and Climate Change, 2023, 13(8): 684-700. DOI:10.9734/ijecc/2023/v13i81997 |
[12] | Mishra G, Sulieman M M, Kaya F, et al. Machine learning for cation exchange capacity prediction in different land uses[J]. CATENA, 2022, 216. DOI:10.1016/j.catena.2022.106404 |
[13] | Saidi S, Ayoubi S, Shirvani M, et al. Comparison of different machine learning methods for predicting cation exchange capacity using environmental and remote sensing data[J]. Sensors, 2022, 22(18). DOI:10.3390/s22186890 |
[14] | Ng W, Minasny B, Montazerolghaem M, et al. Convolutional neural network for simultaneous prediction of several soil properties using visible/near-infrared, mid-infrared, and their combined spectra[J]. Geoderma, 2019, 352: 251-267. DOI:10.1016/j.geoderma.2019.06.016 |
[15] | Khanal S, Fulton J, Klopfenstein A, et al. Integration of high resolution remotely sensed data and machine learning techniques for spatial prediction of soil properties and corn yield[J]. Computers and Electronics in Agriculture, 2018, 153: 213-225. DOI:10.1016/j.compag.2018.07.016 |
[16] |
杨君珑, 李小伟. 宁夏不同草地类型土壤有机碳组分特征[J]. 生态环境学报, 2017, 26(1): 55-61. Yang J L, Li X W. The characteristic of soil organic carbon fraction in different grassland types in Ningxia[J]. Ecology and Environmental Sciences, 2017, 26(1): 55-61. |
[17] |
王晓东, 田伟, 张雪艳. 宁夏地区地下水金属元素分布特征及健康风险评价[J]. 环境科学, 2022, 43(1): 329-338. Wang X D, Tian W, Zhang X Y. Distribution characteristics and health risk assessment of metal elements for groundwater in the Ningxia region of China[J]. Environmental Science, 2022, 43(1): 329-338. |
[18] |
姬丽, 马琨, 谢铁娜, 等. 宁夏供港蔬菜田土壤重金属分布特征及生态风险评价[J]. 环境科学, 2024, 45(6): 3512-3522. Ji L, Ma K, Xie T N, et al. Evaluation of heavy metal distribution characteristics and ecological risk of soil of vegetable land for Hong Kong in Ningxia[J]. Environmental Science, 2024, 45(6): 3512-3522. |
[19] | 鲍士旦. 土壤农化分析[M]. ((第三版)). 北京: 中国农业出版社, 2000. |
[20] |
刘雪梅, 黄元仿. 应用激光粒度仪分析土壤机械组成的实验研究[J]. 土壤通报, 2005, 36(4): 579-582. Liu X M, Huang Y F. An experiment study on employing laser grain-size analyzer to analyze soil mechanical composition[J]. Chinese Journal of Soil Science, 2005, 36(4): 579-582. |
[21] |
段子豪. 镉污染土壤生物炭修复效果与生命周期分析[D]. 武汉: 华中农业大学, 2022. Duan Z H. Effect and life cycle analysis of biochar remediation in cadmium-contaminated soil[D]. Wuhan: Huazhong Agricultural University, 2022. |
[22] | 邱锡鹏. 神经网络与深度学习[M]. 北京: 机械工业出版社, 2020. |
[23] |
李旭青, 李龙, 庄连英, 等. 基于小波变换和BP神经网络的水稻冠层重金属含量反演[J]. 农业机械学报, 2019, 50(6): 226-232. Li X Q, Li L, Zhuang L Y, et al. Inversion of heavy metal content in rice canopy based on wavelet transform and BP neural network[J]. Transactions of the Chinese Society for Agricultural Machinery, 2019, 50(6): 226-232. |
[24] |
刘亚珲, 赵倩. 基于聚类经验模态分解的CNN-LSTM超短期电力负荷预测[J]. 电网技术, 2021, 45(11): 4444-4451. Liu Y H, Zhao Q. Ultra-short-term power load forecasting based on cluster empirical mode decomposition of CNN-LSTM[J]. Power System Technology, 2021, 45(11): 4444-4451. |
[25] | Zhang J F, Huang Y M, Wang Y H, et al. Multi-objective optimization of concrete mixture proportions using machine learning and metaheuristic algorithms[J]. Construction and Building Materials, 2020, 253. DOI:10.1016/j.conbuildmat.2020.11920 |
[26] | Ly H B, Nguyen M H, Pham B T. Metaheuristic optimization of Levenberg–Marquardt-based artificial neural network using particle swarm optimization for prediction of foamed concrete compressive strength[J]. Neural Computing and Applications, 2021, 33(24): 17331-17351. |
[27] |
张晓凤, 王秀英. 灰狼优化算法研究综述[J]. 计算机科学, 2019, 46(3): 30-38. Zhang X F, Wang X Y. Comprehensive review of grey wolf optimization algorithm[J]. Computer Science, 2019, 46(3): 30-38. |
[28] |
王俊, 冯军, 张戈, 等. 基于改进灰狼优化算法的医学数据特征选择应用研究[J]. 河南大学学报(自然科学版), 2020, 50(5): 570-578. Wang J, Feng J, Zhang G, et al. Application research of medical data feature selection based on improved grey wolf optimization algorithm[J]. Journal of Henan University (Natural Science), 2020, 50(5): 570-578. |
[29] |
孙意凡, 刘仁杰, 李世超, 等. 基于GWO-MPC的联合收获机喂入量控制方法与仿真实验[J]. 农业机械学报, 2023, 54(11): 83-91. Sun Y F, Liu R J, Li S C, et al. Feed rate control method and simulation experiment of combine harvester based on GWO-MPC[J]. Transactions of the Chinese Society for Agricultural Machinery, 2023, 54(11): 83-91. |
[30] | Jamieson P D, Porter J R, Wilson D R. A test of the computer simulation model ARCWHEAT1 on wheat crops grown in New Zealand[J]. Field crops research, 1991, 27(4): 337-350. |
[31] |
戴彬, 吕建树, 战金成, 等. 山东省典型工业城市土壤重金属来源、空间分布及潜在生态风险评价[J]. 环境科学, 2015, 36(2): 507-515. Dai B, Lv J S, Zhan J C, et al. Assessment of sources, spatial distribution and ecological risk of heavy metals in soils in a typical industry-based city of Shandong province, eastern China[J]. Environmental Science, 2015, 36(2): 507-515. DOI:10.13227/j.hjkX.2015.02.018 |
[32] |
吴宇宏, 杜宁, 王莉, 等. 基于iLME+Geoi-RF模型的四川省PM2.5浓度估算[J]. 环境科学, 2021, 42(12): 5602-5615. Wu Y H, Du N, Wang L, et al. Estimation of PM2.5 concentration in Sichuan province based on improved linear mixed effect model and geo-intelligent random forest[J]. Environmental Science, 2021, 42(12): 5602-5615. |
[33] |
段亚楠, 刘恩太, 陈学森, 等. 冻融对老龄苹果园土壤微生物数量及酶活性的影响[J]. 土壤, 2021, 53(1): 125-132. Duan Y N, Liu E T, Chen X S, et al. Effects of freezing-thawing on soil microbial quantities and enzymatic activities of old apple orchards[J]. Soils, 2021, 53(1): 125-132. |
[34] | Arthur E. Rapid estimation of cation exchange capacity from soil water content[J]. European Journal of Soil Science, 2017, 68(3): 365-373. |
[35] | Woodruff W F, Revil A. CEC‐normalized clay‐water sorption isotherm[J]. Water Resources Research, 2011, 47(11). DOI:10.1029/2011WR010919 |
[36] |
李艳, 郝占魁, 石强, 等. 黑龙江西部地区土壤pH值、阳离子交换量和有机质的分布特征[J]. 防护林科技, 2020(4): 20-22. Li Y, Hao Z K, Shi Q, et al. Distribution characteristics of soil pH, cation exchange capacity and organic matter in the area of western Heilongjiang Province[J]. Protection Forest Science and Technology, 2020(4): 20-22. |
[37] |
杨亚楠, 刘均阳, 王佩佩, 等. 黄土高原典型植被群落对土壤表面电化学性质的影响及其空间差异[J]. 水土保持学报, 2022, 36(3): 345-351. Yang Y N, Liu J Y, Wang P P, et al. Effects of typical vegetation communities on soil surface electrochemical properties and their spatial difference on the loess Plateau[J]. Journal of Soil and Water Conservation, 2022, 36(3): 345-351. |
[38] |
王幼奇, 张兴, 赵云鹏, 等. 基于GIS和地理加权回归的砂田土壤阳离子交换量空间预测[J]. 土壤, 2020, 52(2): 421-426. Wang Y Q, Zhang X, Zhao Y P, et al. Interpolation of soil CEC of sandy fields using GIS and geographically weighted regression-Kriging[J]. Soils, 2020, 52(2): 421-426. |
[39] | 于天仁, 陈志诚. 土壤发生中的化学过程[M]. 北京: 科学出版社, 1990. |
[40] | Kuzyakov Y, Bogomolova I, Glaser B. Biochar stability in soil: decomposition during eight years and transformation as assessed by compound-specific 14C analysis[J]. Soil Biology and Biochemistry, 2014, 70: 229-236. |
[41] |
王文艳, 张丽萍, 刘俏. 黄土高原小流域土壤阳离子交换量分布特征及影响因子[J]. 水土保持学报, 2012, 26(5): 123-127. Wang W Y, Zhang L P, Liu Q. Distribution and affecting factors of soil cation exchange capacity in watershed of the loess Plateau[J]. Journal of Soil and Water Conservation, 2012, 26(5): 123-127. |
[42] |
马任甜, 胡斐南, 刘婧芳, 等. 黄土高原植被恢复过程中土壤表面电化学性质演变特征[J]. 土壤学报, 2020, 57(2): 392-402. Ma R T, Hu F N, Liu J F, et al. Evolution of soil surface electrochemical characteristics with vegetation restoration on loess Plateau in Ziwuling area[J]. Acta Pedologica Sinica, 2020, 57(2): 392-402. |
[43] |
许亚琪. 土壤阳离子交换量的分析结果研究[J]. 干旱环境监测, 2018, 32(1): 19-23. Xu Y Q. Study on the analytical results of soil cationic exchange capacity[J]. Arid Environmental Monitoring, 2018, 32(1): 19-23. |
[44] | Tan K, Ma W B, Wu F Y, et al. Random forest–based estimation of heavy metal concentration in agricultural soils with hyperspectral sensor data[J]. Environmental Monitoring and Assessment, 2019, 191(7). DOI:10.1007/s10661-019-7510-4 |
[45] | Makungwe M, Chabala L M, Chishala B H, et al. Performance of linear mixed models and random forests for spatial prediction of soil pH[J]. Geoderma, 2021, 397. DOI:10.1016/j.geoderma.2021.115079 |
[46] |
柳小桐. BP神经网络输入层数据归一化研究[J]. 机械工程与自动化, 2010(3): 122-123, 126. Liu X T. Study on data normalization in BP neural network[J]. Mechanical Engineering & Automation, 2010(3): 122-123, 126. |
[47] |
刘明杰, 徐卓揆, 郜允兵, 等. 基于机器学习的稀疏样本下的土壤有机质估算方法[J]. 地球信息科学学报, 2020, 22(9): 1799-1813. Liu M J, Xu Z K, Gao Y B, et al. Estimating soil organic matter based on machine learning under sparse sample[J]. Journal of Geo-Information Science, 2020, 22(9): 1799-1813. |
[48] |
李登峰. 印刷体新傣泐文字符识别方法研究[D]. 昆明: 云南大学, 2016. Li D F. Printed new Tai Lue character recognition technology study[D]. Kunming: Yunnan University, 2016. |
[49] |
吴艳娟, 刘振朝, 王云亮. 基于IPOA的太阳电池模型参数辨识[J]. 太阳能学报, 2024, 45(1): 1-10. Wu Y J, Liu Z C, Wang Y L. Parameter identification of solar cell model based on IPOA[J]. Acta Energiae Solaris Sinica, 2024, 45(1): 1-10. |
[50] |
王彦凯, 王时龙, 杨波, 等. 一种实际多约束环境下的云制造服务组合动态自适应重构方法[J]. 机械工程学报, 2023, 59(14): 339-351. Wang Y K, Wang S L, Yang B, et al. Dynamic adaptive reconfiguration method for cloud manufacturing service composition in practical multi-constraint environment[J]. Journal of Mechanical Engineering, 2023, 59(14): 339-351. |