环境科学  2025, Vol. 46 Issue (4): 2301-2312   PDF    
黄土丘陵区土壤有机碳含量影响因素分析及空间估测
霍瑢彦町1,2, 刘京1,2, 张锐1,2, 林桂玲1,2, 代睿1,2     
1. 西北农林科技大学资源环境学院, 杨凌 712100;
2. 农业农村部西北旱地农业绿色低碳重点实验室, 杨凌 712100
摘要: 土壤有机碳(SOC)是土壤肥力的重要评价指标, 了解其空间分布特征和影响因素对促进农业可持续发展和国家粮食安全具有重要意义. 以陕西省延安市富县为研究对象, 从地形、气候、植被及土壤这4种类型环境因子中选取与SOC形成相关的22个环境变量, 使用随机森林(RF)、支持向量机(SVM)和地理加权回归(GWR)这3种数字土壤制图方法建立SOC含量估测模型, 分析了研究区全域、园地、耕地和林地0~20 cm土壤深度的SOC含量影响因素及其空间分布特征. 结果表明:①富县全域ω(SOC)的平均值为8.54 g·kg-1, 园地ω(SOC)的平均值为6.44 g·kg-1, 耕地ω(SOC)的平均值为7.49 g·kg-1, 林地ω(SOC)的平均值为10.22 g·kg-1;变异系数分别为36.90%、19.24%、29.88%和32.56%, 均属于中等变异程度;②富县全域中, 地形、气候、植被和土壤因子均显著影响SOC分布, 且对SOC的作用方向差异较大;林地中, 坡度(SLP)、年平均温度(MAT)和土壤容重(BD)对SOC有显著的负向作用, 年平均降水量(MAP)和全氮(TN)对SOC有显著的正向作用;园地中, pH、TN和全钾(TK)均对SOC有显著的正向作用;耕地中, MAP对SOC有显著的负向作用, TN对SOC有显著的正向作用;③对比不同估测模型的性能, RF估测模型的决定系数(R2)最高、均方根误差(RMSE)和平均绝对误差(MAE)最低, 模型估测误差最小;在实测值和估测值线性拟合结果中, RF的拟合精度R2达到了0.85以上, 模型的估测性能最好;④使用RF模型对富县的SOC含量进行空间估测, 结果显示全域SOC含量呈现出东低西高的空间分布特征. 研究结果可为黄土丘陵区用地结构优化调整提供决策参考以及对SOC的准确估测提供技术支持.
关键词: 黄土高原      土壤有机碳(SOC)      随机森林(RF)      空间估测      数字土壤制图(DSM)     
Influencing Factors Analysis and Spatial Estimation of Soil Organic Carbon Content in the Hilly Areas of the Loess Plateau
HUO Rong-yan-ting1,2 , LIU Jing1,2 , ZHANG Rui1,2 , LIN Gui-ling1,2 , DAI Rui1,2     
1. College of Natural Resources and Environment, Northwest A&F University, Yangling 712100, China;
2. Key Laboratory of Low-carbon Green Agriculture in Northwestern China, Ministry of Agriculture and Rural Affairs, Yangling 712100, China
Abstract: Soil organic carbon (SOC) is a crucial indicator for assessing soil fertility. Understanding its spatial distribution patterns and influencing factors is essential for enhancing agricultural sustainability and securing national food security. This study focused on the Fuxian County, Yan'an City, and Shaanxi Province, selecting 22 environmental variables related to SOC formation from four types of environmental factors: topography, climate, vegetation, and soil. Three digital soil mapping methods, random forest (RF), support vector machine (SVM), and geographically weighted regression (GWR), were employed to establish SOC content estimation models. The influencing factors and spatial distribution characteristics of SOC content at 0-20 cm soil depth for the entire study area, garden land, cultivated land, and forest land were analyzed. The results showed that: ① The average ω(SOC) across the entire region of the Fuxian County was 8.54 g·kg-1, with garden land at 6.44 g·kg-1, cultivated land at 7.49 g·kg-1, and forest land at 10.22 g·kg-1. The coefficients of variation were 36.90%, 19.24%, 29.88%, and 32.56%, respectively, all of which fall into the moderate degree of variation. ② In the entire region of the Fuxian County, topography, climate, vegetation, and soil factors all significantly affected the distribution of SOC, with notable differences in their effects on SOC. In forest land, slope (SLP), mean annual temperature (MAT), and bulk density (BD) had significant negative effects on SOC, while mean annual precipitation (MAP) and total nitrogen (TN) had significant positive effects on SOC. In garden land, pH, TN, and total potassium (TK) all had significant positive effects on SOC. In cultivated land, MAP had a significant negative effect on SOC, while TN had a significant positive effect. ③ Comparing the performance of different estimation models, the RF estimation model used in this study had the highest R2, the lowest root mean square error (RMSE) and mean absolute error (MAE) values, and the smallest model prediction error. In the linear fitting between measured and estimated values, the RF model's fitting accuracy R2 reached above 0.85, demonstrating the best estimation performance among the models. ④ Utilizing the RF model for spatial estimation of SOC content in the Fuxian County revealed a distribution pattern of lower concentrations in the east and higher in the west. The results can provide decision-making reference for the optimization and adjustment of land-use structure in hilly areas of the Loess Plateau and offer technical support for the accurate estimation of SOC.
Key words: Loess Plateau      soil organic carbon (SOC)      random forest (RF)      spatial estimation      digital soil mapping(DSM)     

土壤作为人类赖以生存和发展的重要资源之一, 其质量状况关系着人类活动所必须的粮食保障[1]. 土壤有机碳(soil organic carbon, SOC)可以促进植物的生长和发育, 是土壤肥沃程度的重要指标. 同时, SOC是生物圈中最大的碳库, 对气候变化的调节潜力巨大[2~4]. 准确地了解SOC的空间分布状况及其空间异质性的影响因素, 对促进区域农业的可持续发展, 实现农业信息化、智能化乃至国家粮食安全具有重要意义.

数字土壤制图技术(digital soil mapping, DSM)是目前新兴的、主流的表达土壤空间分布状况的方法[5, 6]. DSM以土壤-景观模型为理论基础, 以空间分析和数学方法为技术手段建立空间尺度的数学模型来获取土壤-景观知识, 估测未知区域的土壤属性[7, 8], 最后形成科学的土壤属性空间分布图. 该方法的应用极大地减少了人为干预, 弥补了传统土壤属性制图周期长、成本高、缺少细小图斑等缺陷, 提高了制图的精度和准确性. 目前, 多元线性回归(multiple linear regression, MLR)、随机森林(random forest, RF)、支持向量机(support vector machine, SVM)和地理加权回归(geographically weighted regression, GWR)模型等方法广泛应用于土壤属性空间分布的研究[9~11]. 不同模型的优缺点各不相同, 其中RF模型是目前使用较广泛的一种机器学习模型, 其约束条件较少, 可使用的领域范围广, 可以较好地估测不同土壤深度SOC的含量[12];SVM模型在处理高维数据时表现突出[13];GWR模型能较准确地表达土壤属性的空间变化[14]. 在数字土壤制图中, 环境协变量的选择是土壤-景观模型建立过程中的一个重要环节. 环境协变量的选择不仅要基于以往研究案例的推断, 而且还要考虑土壤属性形成过程的相关性[15, 16]. 在不同区域, SOC的DSM方法以及环境因子的选取尚未形成统一的结论. 以往研究中, 母质、地形、气候与生物(主要是植被)这4类环境协变量被广泛用于数字土壤制图中, 而其他因子(如土壤和时间)由于获取难度较大等原因, 使用得较少[17].

黄土丘陵区是我国水土流失最严重的地区[18], 1999年国家实施退耕还林(草)政策以来, 该区域植被覆盖率显著提升, 成为我国植被变绿增幅最大的区域之一[19]. 许多学者对该区域的退耕恢复植被的SOC分布特征及其影响因素进行了大量研究[20, 21]. 然而, 大多研究仅使用传统地统计学的克里金插值方法生成SOC空间分布图, 但在地形变化较大的区域, 该方法进行空间估测的准确度较低, 误差较大[22], 不能很好地表达SOC的空间分布;此外, 已有研究多从不同植被覆盖类型的角度探究SOC的分布特征及其影响因素, 少有分析不同土地利用类型SOC含量的分布规律及其影响因素, 良好的土地利用结构和土壤管理方式, 对促进农业可持续发展具有重要意义.

鉴于此, 本文以黄土丘陵区富县为研究对象, 从地形、气候、植被以及土壤这4类环境因子中选取与SOC形成相关的22个环境变量, 使用RF、SVM和GWR这3种方法建立SOC含量估测模型, 分析全域、园地、耕地和林地表层土壤的SOC含量影响因素及其空间分布特征, 以期为黄土丘陵区用地结构优化调整提供决策参考及为农业可持续发展提供理论支持.

1 材料与方法 1.1 研究区概况

富县地处渭北黄土高原丘陵沟壑地带, 位于陕西省北部、延安市南部, 地域辽阔, 是延安市面积最大的县域, 地形起伏较大, 地理位置位于东经108°29′~109°42′, 北纬35°44′~36°23′之间(图 1), 属于大陆性干旱半干旱气候, 年均气温9.6℃, 年平均降水量561.0 mm, 水热资源较丰富. 富县的苹果产业建设突出, 果园占园地总面积的99.67%;耕地主要以旱地为主, 主要的粮食作物为小麦、玉米和水稻.

图 1 研究区位置示意 Fig. 1 Location of the study area

1.2 数据来源及预处理 1.2.1 采样点数据

通过调查研究区的实际情况, 根据研究区土壤类型、土地利用类型、地形等要素组合布设采样点, 采样点要尽可能地覆盖整个研究区, 按照“随机”、“等量”和“多点混合”的原则进行土壤表层样的采集, 采集深度为0~20 cm, 同时用手持GPS记录样点的经纬度, 获得对应的SOC实测样点数据共498个. 土壤有机碳测定采用重铬酸钾容量法, 土壤全氮测定采用半微量凯氏法, 土壤速效钾测定采用乙酸铵浸提-火焰光度法, 土壤有效磷测定采用碳酸氢铵浸提-钼锑抗比色法, 采用酸溶-钼锑抗比色法测定土壤样品中的全磷含量, 通过火焰光度法测定全钾含量, pH测定采用电位法, 土壤机械组成(黏粒、粉粒和砂粒含量)采用湿筛-吸管法测定[22 ~ 27].

1.2.2 地形因子

研究区数字高程模型从地理空间数据云(Geospatial Data Cloud, http://www.gscloud.cn/)获取ASTER GDEM数据, 空间分辨率为30 m. 利用高程数据计算得到地形因子, 如坡向(aspect, ASP)、坡度(slope, SLP)、平面曲率(plan curvature, PLAN)、剖面曲率(profile curvature, PROF)、地表粗糙度(terrain ruggedness index, SRI)和地形湿度指数(topographic wetness index, TWI).

1.2.3 气候因子

本研究使用的气候因子为年平均温度(mean annual temperature, MAT)和年平均降水量(mean annual precipitation, MAP), 数据来源于国家气象科学数据中心(https://data.cma.cn/). 获取研究区及其周边4个县连续3 a的气温和降水数据, 计算3 a的年平均降水量和年平均气温, 插值生成分辨率为30 m的栅格图层.

1.2.4 植被因子

植被在SOC积累和分解过程中起着重要作用, 归一化植被指数(normalized difference vegetation index, NDVI)可以反映植被的健康状态和植被覆盖度, 间接反映SOC的情况[28]. NDVI指数可以通过遥感影像不同波段计算得到, 遥感影像选用Landsat 8卫星影像, 数据来源于地理空间数据云, 空间分辨率为30 m. 根据研究区植被生长情况, 选择成像时间为2021年8月2日云量为3.11%的影像, 对影像进行投影变换、校正、裁剪、去云等预处理. 最后通过影像的波段计算得到NDVI值, 计算公式为:

(1)

式中, NIR为近红外波段的反射值, R为红光波段的反射值. NDVI的取值范围为[-1, 1], 负值表示非植被覆盖的区域;0表示有岩石或裸土等, NIR和R近似相等;正值表示有植被覆盖, 且随覆盖度增大而增大.

1.2.5 土壤因子

土壤因子与SOC密切相关, 可以作为SOC空间异质性的解释变量[29, 30]. 本文使用:土壤容重(bulk density, BD)、黏粒含量(Clay, 0.002 mm以下的颗粒)、粉粒含量(Silt, 0.002~0.02 mm的颗粒)、细砂粒含量(Sand1, 0.02~0.2 mm的颗粒)、粗砂粒含量(Sand2, 0.2~2 mm的颗粒)、pH、土壤速效钾(available potassium, AK)、土壤有效磷(available phosphorus, AP)、土壤全氮(total nitrogen, TN)、土壤全钾(total potassium, TK)、土壤全磷(total phosphorus, TP)、土地利用类型(land use type, LUT)和土壤类型(Soil)作为土壤协变量估测SOC含量. 土壤协变量的实测值采用普通克里金法进行空间插值后, 对插值形成的30 m空间分辨率栅格图层根据研究区的行政区划进行掩膜和裁剪等预处理.

1.3 数据处理与分析

① 样点数据根据3σ原则识别数据的异常值[31], 将异常值按缺失值处理, 使用随机森林的机器学习方法补充缺失值, 后续使用处理后的数据进行分析. ②对所有环境变量进行共线性检验, 剔除方差膨胀因子(VIF) > 10、共线性较强的变量, 研究区全域和各土地利用类型均剔除的变量有Sand1(细砂粒)和TRI(地形崎岖指数), 此外耕地还剔除了SLP(坡度), 使用剩余环境变量构建数据集, 在R 4.2.2软件中完成. ③地形和气候因子的提取、土壤因子的空间插值以及栅格数据掩膜等预处理在ArcGIS 10.8软件中完成, 统一坐标系为WGS_1984_UTM_Zone_ 49N. ④将土地利用类型和土壤类型两个分类变量转换为虚拟变量后再建立模型[32], 土地利用类型有林地、园地和耕地, 以林地为参考类型;土壤类型有黑垆土、黄绵土、灰褐土、水稻土和新积土, 以灰褐土为参考类型构建数据集. ⑤利用构建好的数据集建立RF、SVM和GWR模型, 比较建模结果, 在R 4.2.2软件中完成.

1.4 研究方法 1.4.1 地理加权回归(GWR)

GWR是以地理学第一定律为理论基础的空间估测方法, 在MLR模型的基础上增加了空间位置信息参与建模, 地理数据考虑空间异质性可以提高模型估测的准确性. GWR是典型的局部回归模型, 即在每一个点上建立一个独立的线性回归模型[14], 公式如下:

(2)

式中, (uivi)为第i个样点的空间坐标;YiXik为在空间位置i处的因变量Y和自变量集Xkm为自变量个数;β0(uivi)为空间位置(uivi)处的常数项;βk(uivi)为第i个采样点上第k个自变量的回归系数[11].

本研究中, GWR模型的空间权重函数选择gwr.Gauss(高斯函数), 依据交叉验证法(cv)确定最优带宽.

1.4.2 随机森林(RF)

RF是一种用来分类和回归的集成学习方法, 在训练时会构建许多决策树, 每棵树的训练集都进行了随机子样本的抽取, 大约2/3的样本用于训练模型, 剩余1/3的样本被排除在外, 用来检验模型误差, 这称为袋外(out-of-bag, OOB)数据[6]. RF因其强大的学习能力和鲁棒性, 可以很好地解决多变量非线性问题, 以及可以对模型中的变量进行重要性排序, 常用于数字土壤制图研究中[33].

建立RF模型需要设置两个参数, 分别为ntree和mtry. ntree表示树的个数(默认为500), mtry为每个决策树划分时考虑的特征变量数. 本研究通过十折交叉验证进行超参数调优, 使模型达到最好的估测效果.

1.4.3 支持向量机(SVM)

SVM是由Cortes等[34]提出的一种监督类的机器学习算法, 可用于处理分类和回归问题. SVM模型可以很好地处理小样本和噪声较多的数据, 其原理可解释为将线性不可划分的数据通过升维的方式拓展到高维空间中, 依据结构化风险最小化原则, 在高维空间构建一个最佳超平面来区分数据[35, 36].

建立SVM模型前将数据集通过“scale”方法标准化, 使用交叉验证的方法重复10次选择最优超参数, 根据均方根误差最小为最优模型的原则对模型进行训练.

1.4.4 模型建立与评价

为了评估模型的准确度和精确性, 使用“caret”包中的createDataPartition函数, 将总样本70%的样本数作为训练集, 30%的样本数作为测试集. 使用决定系数(R2)和均方根误差(root mean square error, RMSE)以及平均绝对误差(mean absolute error, MAE)对估测模型进行精度评价. R2、RMSE和MAE的公式如下所示:

(3)
(4)
(5)

式中,yi为样本i的实测值;i为对应样本i的预测值;y为样本的平均值;n为样本数. MAE可以定量化反映实测值与预测值之间的误差情况;RMSE为实测值与预测值之差的平方的期望,可以反映预测值的偏差大小;R2可以反映模型的拟合程度. MAE和RMSE越小,R2越接近于1,模型的预测结果越准确;反之,模型的预测结果越差.

2 结果与分析 2.1 采样点基础数据统计

研究区用于SOC估测的样本点统计值见表 1, 总样本ω(SOC)范围为1.82~17.98 g·kg-1, 平均值为8.54 g·kg-1, SOC含量的标准差为3.15 g·kg-1, 变异系数为36.90%, 属于中等变异, 说明SOC含量在空间上有一定的异质性. 训练集与总样本的最小值一致, 均小于测试集的最小值;测试集与总样本的最大值一致, 均大于训练集的最大值. 研究区的总样本数据与训练集数据和测试集数据之间具有相似的统计特征, 训练集和测试集的数据具有一定的代表性, 可以参与模型的建立并对SOC含量进行估测分析.

表 1 SOC数据描述性统计特征 Table 1 Descriptive statistical characteristics of SOC data

各类型农用地SOC含量的统计特征见表 2, 园地ω(SOC)范围为3.86~13.05 g·kg-1, 平均值为6.44 g·kg-1;耕地ω(SOC)范围为3.10~12.82 g·kg-1, 平均值为7.49 g·kg-1;林地ω(SOC)范围为1.82~17.98 g·kg-1, 平均值为10.22 g·kg-1;变异系数分别为19.24%、29.88%和32.56%, 均属于中等变异. 各类型农用地SOC含量差异较大, 从大到小为:林地 > 耕地 > 园地.

表 2 不同类型农用地SOC含量描述性统计特征 Table 2 Descriptive statistical characteristics of SOC content in different types of agricultural land

2.2 县域SOC估测模型运算结果与分析

GWR模型结果见表 3, 地形、植被、气候和土壤因素均对富县全域SOC含量的分布有着影响作用. 地形因素中, 显著影响研究区SOC分布的因子为PLAN和SRI, 且回归系数为正值, 说明PLAN和SRI的值越大越有利于SOC的积累;植被因素中, NDVI的回归系数为正值且对SOC分布有显著的影响作用, 说明植被覆盖的增加可以促进SOC的积累;气候因素中, MAT的回归系数为负值且对SOC有显著的影响, 表明温度的升高会抑制全域SOC的积累;土壤因素中, 显著影响SOC分布的因子为BD、Sand2、TN、园地、耕地和黄绵土, 其中各类型农用地均对SOC分布有着突出的影响作用, 而土壤类型中只有黄绵土的影响作用显著. 此外, 残差项对SOC分布有极显著的正向影响, 表明土壤微生物和人类活动等其他因素对SOC的积累具有促进作用.

表 3 SOC模型各因子的回归系数值1) Table 3 Regression coefficient values of factors in SOC model

RF和SVM模型结果如图 2(a)图 3(a)所示, 两个模型中TN、MAT和MAP均排名靠前, 说明土壤因子和气候因子均对模型的估测结果影响较大;而地形因子和植被因子在两个模型的变量重要性排序中均靠后, 这可能是因为土壤因子和气候因子对SOC估测结果的影响远大于地形和植被因子对SOC估测的影响, 从而削弱了地形和植被因子的影响作用, 使其在重要性排序中并不突出, 但通过回归结果(表 3)的分析可知不能忽略其对SOC的影响, 对SOC进行空间估测建模时要保留地形和植被因子.

图 2 RF模型中环境变量的相对重要性 Fig. 2 Relative importance of environmental covariates in RF model

图 3 SVM模型中环境变量的相对重要性 Fig. 3 Relative importance of environmental covariates in SVM model

2.3 不同类型农用地SOC的影响因素分析

表 3可知, 残差项和TN对各类型农用地SOC的分布均有显著的影响, 其他因子在不同类型农用地中对SOC分布的影响程度有所差异. 在园地中, 显著影响SOC分布的环境因子为残差项、pH、TN和TK, 且回归系数都为正值, 说明土壤因子和残差项所包含的其他因素的增加对园地SOC的积累有促进作用;在耕地中, 残差项、MAP和TN为显著影响SOC分布的环境因子, 其中MAP的回归系数为负值, 残差项和TN的回归系数为正值, 说明降水的增加会抑制耕地SOC的积累, 而氮元素和残差项则会促进耕地SOC的积累;在林地中, 显著影响SOC分布的环境因子为残差项、SLP、MAP、MAT、BD和TN, 其中SLP、MAT和BD的回归系数为负值, 说明这些因素对林地SOC有抑制作用, MAP、TN和残差项的回归系数为正值, 说明这些因素对林地SOC有促进作用.

RF和SVM模型结果如图 2图 3所示, TN在各类型农用地的变量重要性排序中均排在第一位, 对SOC估测结果的影响程度最大, 其他因子在不同类型农用地中对SOC估测结果有着不同程度的影响. 图 2(b)图 3(b)园地SOC估测模型的结果中TN、TK、AK和TP均排名靠前, 图 2(c)图 3(c)耕地SOC估测模型的结果中TN和AK皆排名靠前, 图 2(d)图 3(d)林地SOC估测模型的结果中TN、BD、AP和Sand2均排名靠前, 说明不同模型对各类型农用地SOC估测时影响其估测结果的主要环境因子为土壤因子.

2.4 模型精度对比

由研究区SOC估测结果可以看出(表 4), 不同方法估测的SOC含量的平均值都与实测值的平均值(8.54 g·kg-1)相近, 3种模型估测的SOC含量的最小值均大于实测值的最小值(1.82 g·kg-1), 最大值均小于实测值的最大值(17.98 g·kg-1), 估测的SOC含量的范围有一定程度的压缩, 这与任必武等[37]估测亚热带复杂地貌区耕地SOC的结果一致. 总体来看, RF和SVM模型在低值区的估测结果更接近实测值, RF在回归过程中会平滑掉极值, 使估测结果整体达到最优;而SVM对极值的估测比RF更准确;相比于RF和SVM模型, GWR模型在低值区存在明显的高估, 但在高值区的估测结果更接近实测值.

表 4 3种模型对SOC含量估测结果分析 Table 4 Analysis of SOC content estimation results by three models

使用测试集数据, 对3种估测模型的精度进行评价, 结果如表 4所示. 所有模型的R2均达到了60%以上, RMSE和MAE均在2 g·kg-1以下, 说明所有模型都有较好的拟合效果, 环境因子对SOC的解释度良好. 其中, RF估测模型的性能最好(R2=0.784 0, RMSE=1.650 5 g·kg-1, MAE=1.142 7 g·kg-1), 说明在地势起伏较大的区域, RF能更好地解决SOC与环境因子之间的非线性问题. 相较于RF模型, GWR和SVM模型的估测精度均有所下降, R2减少了7.53%~17.44%, RMSE增加了6.82%~18.17%, MAE增加了9.64%~19.22%.

为进一步探究不同模型在黄土丘陵区的估测精度, 对研究区表层SOC估测值和实测值建立线性拟合模型, 结果如图 4所示. 研究区估测值与实测值拟合结果中, RF模型的拟合精度最高, R2达到0.85以上;SVM次之, R2达到0.8以上;GWR的拟合效果最差, 估测值与实测值的拟合精度R2只有0.686 6, 且拟合点分布的离散程度较大, 模型的可靠性较低, 在低值区存在明显的高估现象. 通过上述分析结合表 4图 4的结果, 总体上RF模型的表现最佳, 结果更加可靠, 可以更好地模拟黄土丘陵区SOC含量的空间分布情况.

图 4 不同模型估测值与实测值线性拟合结果 Fig. 4 Linear fitting results of estimated values and measured values from different models

2.5 SOC含量的空间估测

使用估测性能最好的RF模型对全域SOC含量进行空间估测, 结果如图 5所示. 研究区ω(SOC)范围为3.79~14.97 g·kg-1, SOC含量呈现出东部地区含量低, 西部地区含量高的空间分布特征, 总体上有从东向西逐渐增加的趋势, 空间异质性较强. 对比图 6中主要影响因子的空间分布状况可知, MAP、MAT和BD的值越低且SLP、PLAN、SRI、NDVI、Sand2、TN和TK的值越高的区域, SOC含量越高;反之, SOC含量越低, 说明MAP、MAT和BD对SOC有负向作用, 其余影响因子对SOC有正向作用.

图 5 SOC含量估测值空间分布 Fig. 5 Spatial distribution of SOC content estimation values

图 6 研究区主要影响因子空间分布 Fig. 6 Spatial distribution of major influencing factors in the study area

表 5可知, 不同类型农用地的SOC含量差异明显. 园地ω(SOC)范围为3.86~12.10 g·kg-1, 平均值为5.26 g·kg-1;耕地ω(SOC)范围为3.90~13.59 g·kg-1, 平均值为6.14 g·kg-1;林地ω(SOC)范围为3.79~14.97 g·kg-1, 平均值为8.90 g·kg-1. 研究区农用地SOC含量从大到小为:林地 > 耕地 > 园地.

表 5 不同类型农用地的SOC含量空间估测/g·kg-1 Table 5 Spatial estimation of SOC content in different types of agricultural land/g·kg-1

3 讨论 3.1 SOC空间分布与主要影响因子的关系

本研究中, 影响研究区全域表层SOC分布的主要因子为:残差项、PLAN、SRI、MAT、NDVI、BD、Sand2、TN、园地、耕地和黄绵土, 对SOC含量估测结果有主要影响的环境因子为土壤因子和气候因子;影响园地SOC分布的主要因子为残差项、pH、TN和TK;影响耕地SOC分布的主要因子为残差项、MAP和TN;影响林地SOC分布的主要因子为残差项、SLP、MAP、MAT、BD和TN;对园地、耕地和林地SOC含量估测结果有主要影响的环境因子均为土壤因子.

地形因子通过控制土壤的水热条件等影响SOC的空间分布[18], 地形因子对全域(PLAN和SRI)和林地(SLP)SOC分布影响显著, 对园地和耕地SOC的分布影响并不显著, 这可能是因为从全域尺度来看研究区位于黄土丘陵区, 地形起伏较大, 地形因子对SOC的影响突出. 林地占地面积大, 地形差异也较大, 地形因子对SOC的影响显著, 而园地和耕地主要位于地势平坦的区域, 地形差异不大, 地形因子对SOC分布的影响较弱. 气候因子中, MAT对全域和林地SOC有显著的负向影响, MAP对林地SOC有显著的正向影响而对耕地SOC有显著的负向影响, 其原因可能是林地有庞大的根系和丰富的冠层, 对降水有一定的阻截作用[38], 极大程度降低了雨水对土壤的溅蚀, 并且受人类干扰较少, 有利于SOC的积累;相较于林地, 耕地频繁的人类活动易使土壤暴露扰动, 降水会加剧SOC的流失, 使耕地SOC含量降低;近些年随着全球变暖, 气温逐年升高, 对SOC的影响增强[39], 使土壤中微生物活动得越频繁, 加快了有机质的分解速率[40], 减少了SOC的含量. 此外, 研究区林地的占地面积最大, 气温对林地SOC分布的影响效应可能大于降水对林地和耕地SOC的总影响效应, 所以呈现出气温对全域SOC分布的影响显著.

植被覆盖的增加可以促进SOC的积累, 不同植被类型会影响SOC含量的分布情况[18], 植被因子NDVI对全域SOC分布的影响显著, 对园地、耕地和林地SOC分布的影响都不显著, 其原因可能是在小尺度范围内同一种用地类型植被覆盖相似, NDVI对SOC的影响较小, 而不同土地利用类型之间植被覆盖差异较大, 所以在全域尺度包含不同用地类型时NDVI对SOC的影响得以体现. 土壤因子中, 耕地SOC分布受TN的影响显著, 有研究表明耕地SOC主要受氮磷含量的影响[38], 与本文结果一致;研究区园地主要以苹果为主, 在苹果生长期到成熟期会施用相对量大的氮肥和钾肥[41], 所以TN和TK对园地SOC分布的影响显著;此外, 园地SOC分布受pH的影响显著, 原因可能是土壤微生物的活动需要在一定的pH值范围内[40], 研究区园地pH值的提高会减弱微生物的活性, 有利于SOC的积累. Sand2对全域SOC分布为正向的显著影响, 这与杨桦等[42]研究结果相似, 土壤砂粒可以与土壤颗粒有机碳紧密结合, 对土壤中的磷元素进行封存[43], 有效减缓SOC的矿化[42];而土壤砂粒的形成, 会使土壤结构松散、透气性好, 从而降低了土壤容重, 有研究表明BD的降低有利于形成水稳性团聚体[44], 可以较好保护SOC, 降低SOC与微生物的接触, 使得团聚体内的SOC难以被分解[40];TN也显著影响SOC的分布, 这是因为N元素可以促进植物的生长, 有利于SOC的积累. 在林地中, 显著影响SOC分布的土壤因子为BD和TN, 与全域的回归结果相似, 原因可能是林地在全域分布广泛, 占地面积最大, 土壤因子对林地SOC分布的影响效应与土壤因子对全域SOC分布的影响效应相近.

残差项对全域及各类型农用地SOC的分布皆有极显著的正向影响, 说明本文未考虑到的其他因素对研究区SOC具有促进作用, 未来研究中应建立更全面的环境变量数据集, 例如将其他人类活动和时间因素考虑到模型中, 补充更多的信息, 更好地解释环境因子与SOC分布之间的关系. 另外, 在图 2图 3中对SOC含量估测结果有重要影响的部分环境因子在表 3中对SOC分布的影响并不显著, 这可能是因为这些环境因子与SOC之间的关系比较复杂, 是非线性的, 难以通过线性回归系数体现其影响机制, 但在对SOC进行空间估测时需保留这些环境因子以提高估测结果的准确性, 未来应探索其他方法以更好地解释这种现象.

3.2 模型的估测效果分析

模型的精度对比结果中(表 4图 4), 估测模型的精度由大到小排序为:RF > SVM > GWR. 可能在观测值空间自相关性较强的条件下, GWR这种考虑空间位置的局部线性回归模型才可以有较好的估测结果[45], 而本研究的SOC空间自相关性较弱, GWR模型的估测效果较差;RF模型的估测性能最突出, 能更好地处理环境因子与SOC之间的复杂关系, 各项评价指标均优于其他模型, 说明相比于其他两种估测模型, RF这种决策树集成模型更适合用于黄土丘陵区SOC含量的估测中.

使用RF模型对研究区的SOC进行空间估测, 与研究区表 4的样点估测结果进行对比, 发现图 5空间估测值的范围被压缩, 这是因为部分土壤变量是利用样点数据采用普通克里金方法进行空间插值得到, 插值过程中会对样点中的极值进行平滑处理, 所以土壤变量栅格数据值的范围要小于样点值的范围, 从而影响空间估测的结果[46]. 未来应考虑使用更合适的方法对土壤变量进行处理, 提高模型的估测精度. 虽然, RF模型的空间估测值存在一定的误差, 但整体与样点估测结果相近, 可以较好地表达黄土丘陵区SOC的空间分布特征和分布规律, 因此在未来复杂地形环境SOC含量估测的相关研究中, 可优先考虑RF模型的改进与应用.

4 结论

(1)富县全域ω(SOC)的平均值为8.54 g·kg-1, 园地ω(SOC)的平均值为6.44 g·kg-1;耕地ω(SOC)的平均值为7.49 g·kg-1;林地ω(SOC)的平均值为10.22 g·kg-1;变异系数分别为36.90%、19.24%、29.88%和32.56%, 均属于中等变异程度. 各农用地SOC含量差异较大, 从大到小为:林地 > 耕地 > 园地.

(2)地形、气候、植被和土壤因子均对研究区全域SOC分布有重要影响, 除植被因子外, 其余因子皆对林地SOC分布有重要影响;园地SOC分布的主要影响因素为土壤因子;耕地SOC分布的主要影响因素为气候和土壤因子.

(3)本研究中RF估测模型的R2最高, RMSE和MAE最低;在实测值和估测值线性拟合结果中, RF的拟合精度R2达到了0.85以上, 模型的估测性能最好, 可实现SOC含量的精准估测, 能更好地表达SOC的空间分布特征.

(4)使用RF模型对研究区SOC含量进行空间估测, 结果显示全域SOC含量呈现出东低西高的空间分布特征.

参考文献
[1] 张甘霖, 史舟, 王秋兵, 等. 新时代土壤地理学的发展现状与趋势[J]. 土壤学报, 2023, 60(5): 1264-1276.
Zhang G L, Shi Z, Wang Q B, et al. Development of soil geography in the new era and its future[J]. Acta Pedologica Sinica, 2023, 60(5): 1264-1276.
[2] Batjes N H. Mitigation of atmospheric CO2 concentrations by increased carbon sequestration in the soil[J]. Biology and Fertility of Soils, 1998, 27(3): 230-235. DOI:10.1007/s003740050425
[3] Zhang Y, Zhao Y C, Shi X Z, et al. Variation of soil organic carbon estimates in mountain regions: a case study from Southwest China[J]. Geoderma, 2008, 146(3-4): 449-456.
[4] Gomes L C, Faria R M, De Souza E, et al. Modelling and mapping soil organic carbon stocks in Brazil[J]. Geoderma, 2019, 340: 337-350. DOI:10.1016/j.geoderma.2019.01.007
[5] Arrouays D, McBratney A, Bouma J, et al. Impressions of digital soil maps: The good, the not so good, and making them ever better[J]. Geoderma Regional, 2020, 20. DOI:10.1016/j.geodrs.2020.e00255
[6] 聂祥琴, 陈瀚阅, 牛铮, 等. 基于时序影像的农业活动因子提取与闽西耕地SOC数字制图[J]. 地球信息科学学报, 2022, 24(9): 1835-1852.
Nie X Q, Chen H Y, Niu Z, et al. Digital SOC mapping in croplands using agricultural activity factors derived from time-series data in western Fujian[J]. Journal of Geo-information Science, 2022, 24(9): 1835-1852.
[7] 朱阿兴, 杨琳, 樊乃卿, 等. 数字土壤制图研究综述与展望[J]. 地理科学进展, 2018, 37(1): 66-78.
Zhu A X, Yang L, Fan N Q, et al. The review and outlook of digital soil mapping[J]. Progress in Geography, 2018, 37(1): 66-78.
[8] 杨雨菲, 韩浩武, 陈荣, 等. 数字土壤制图的推理方法对比研究[J]. 土壤通报, 2020, 51(5): 1016-1023.
Yang Y F, Han H W, Chen R, et al. Inference methods of digital soil mapping[J]. Chinese Journal of Soil Science, 2020, 51(5): 1016-1023.
[9] Li H, Wang J W, Zhang J X, et al. Combining variable selection and multiple linear regression for soil organic matter and total nitrogen estimation by DRIFT-MIR spectroscopy[J]. Agronomy, 2022, 12(3). DOI:10.3390/agronomy12030638
[10] Siqueira R G, Moquedace C M, Francelino M R, et al. Machine learning applied for Antarctic soil mapping: spatial prediction of soil texture for Maritime Antarctica and Northern Antarctic Peninsula[J]. Geoderma, 2023, 432. DOI:10.1016/j.geoderma.2023.116405
[11] 赵明松, 陈宣强, 徐少杰, 等. 基于MGWR的土壤pH值空间建模及其影响因素分析[J]. 环境科学, 2023, 44(12): 6909-6920.
Zhao M S, Chen X Q, Xu S J, et al. Spatial prediction modeling for soil pH based on multiscale geographical weighted regression (MGWR) and its influencing factors[J]. Environmental Science, 2023, 44(12): 6909-6920.
[12] 沈佳丽, 陈颂超, 胡碧峰, 等. 基于机器学习的江汉平原土壤有机碳预测及制图[J]. 农业资源与环境学报, 2023, 40(3): 644-650.
Shen J L, Chen S C, Hu B F, et al. Prediction and mapping soil organic carbon in Jianghan Plain by machine learning[J]. Journal of Agricultural Resources and Environment, 2023, 40(3): 644-650.
[13] Were K, Bui D T, Dick Ø B, et al. A comparative assessment of support vector regression, artificial neural networks, and random forests for predicting and mapping soil organic carbon stocks across an Afromontane landscape[J]. Ecological Indicators, 2015, 52: 394-403. DOI:10.1016/j.ecolind.2014.12.028
[14] 陈宣强, 赵明松, 卢宏亮, 等. 基于3种地理加权回归方法的安徽省土壤pH空间预测制图对比研究[J]. 地理科学, 2023, 43(1): 173-183.
Chen X Q, Zhao M S, Lu H L, et al. Comparison and analysis of spatial prediction and spatial variability of soil pH in Anhui Province based on three kinds of geographically weighted regression[J]. Scientia Geographica Sinica, 2023, 43(1): 173-183.
[15] Wadoux A M J C, Minasny B, McBratney A B. Machine learning for digital soil mapping: applications, challenges and suggested solutions[J]. Earth-Science Reviews, 2020, 210. DOI:10.1016/j.earscirev.2020.103359
[16] Liang P, Qin C Z, Zhu A X. Comparison on two case-based reasoning strategies of automatically selecting terrain covariates for digital soil mapping[J]. Transactions in GIS, 2021, 25(5): 2419-2437. DOI:10.1111/tgis.12831
[17] Chen S C, Arrouays D, Mulder V L, et al. Digital mapping of GlobalSoilMap soil properties at a broad scale: a review[J]. Geoderma, 2022, 409. DOI:10.1016/j.geoderma.2021.115567
[18] 左启林, 于洋, 查同刚. 晋西黄土小流域土壤有机碳空间分布特征及其影响因素[J]. 生态学杂志, 2024, 43(5): 1373-1380.
Zuo Q L, Yu Y, Zha T G. Spatial distribution and influencing factors of soil organic carbon in loess small watershed in western Shanxi Province[J]. Chinese Journal of Ecology, 2024, 43(5): 1373-1380.
[19] 杨阳, 刘良旭, 童永平, 等. 黄土高原植被恢复过程中土壤碳储量及影响因素研究进展[J]. 地球环境学报, 2023, 14(6): 649-662.
Yang Y, Liu L X, Tong Y P, et al. Advances and driving factors in soil organic carbon storage during vegetation restoration in the Loess Plateau, China[J]. Journal of Earth Environment, 2023, 14(6): 649-662.
[20] 许煜麟, 赵雅萍, 赵雨晴, 等. 黄土高原退耕还林(草)前后土壤有机碳密度变化及其对气候变化和人类活动的响应[J]. 环境科学, 2024, 45(8): 4696-4708.
Xu Y L, Zhao Y P, Zhao Y Q, et al. Changes in soil organic carbon density and its response to climate change and human activities before and after the grain for green project on the Loess Plateau[J]. Environmental Science, 2024, 45(8): 4696-4708.
[21] 沙国良, 陈宇轩, 魏天兴, 等. 黄土高原丘陵区典型退耕恢复植被土壤碳分布特征及其影响因素[J]. 土壤, 2022, 54(6): 1265-1272.
Sha G L, Chen Y X, Wei T X, et al. Distribution of soil carbon and its driving factors under typical restored vegetation in hilly areas of Loess Plateau[J]. Soils, 2022, 54(6): 1265-1272.
[22] 尉芳, 刘京, 夏利恒, 等. 陕西渭北旱塬区农田土壤有机质空间预测方法[J]. 环境科学, 2022, 43(2): 1097-1107.
Wei F, Liu J, Xia L H, et al. Spatial prediction method of farmland soil organic matter in Weibei Dryland of Shaanxi Province[J]. Environmental Science, 2022, 43(2): 1097-1107.
[23] 何林倩, 刘倩, 王德彩, 等. 基于数字土壤制图技术的土壤有机碳储量估算[J]. 应用生态学报, 2021, 32(2): 591-600.
He L Q, Liu Q, Wang D C, et al. Estimation of soil organic carbon storage based on digital soil mapping technique[J]. Chinese Journal of Applied Ecology, 2021, 32(2): 591-600.
[24] 王军, 傅伯杰, 邱扬, 等. 黄土高原小流域土壤养分的空间异质性[J]. 生态学报, 2002, 22(8): 1173-1178.
Wang J, Fu B J, Qiu Y, et al. Spatial heterogeneity of soil nutrients in a small catchment of the Loess Plateau[J]. Acta Ecologica Sinica, 2002, 22(8): 1173-1178.
[25] 张生乐, 李高如, 高美华, 等. 南汇东滩海三棱藨草群落区表层土壤中全氮和全磷含量的时空分布[J]. 湿地科学, 2023, 21(4): 619-625.
Zhang S L, Li G R, Gao M H, et al. Spatiotemporal distribution of total nitrogen and total phosphorus contents in top soil of scirpus mariqueter community area in east tidal flat of Nanhui District[J]. Wetland Science, 2023, 21(4): 619-625.
[26] 张丽萍, 王久荣, 许丽卫, 等. 电感耦合等离子体发射光谱法测定土壤全钾不确定度的评定与表示[J]. 中国土壤与肥料, 2021(2): 343-347.
Zhang L P, Wang J R, Xu L W, et al. Evaluation and expression of measurement uncertainty in determination of total potassium in soil by inductively coupled plasma optical emission spectrometry[J]. Soils and Fertilizers Sciences in China, 2021(2): 343-347.
[27] 马世豪, 王建霄, 张认连, 等. 冀西山前冲积扇区土壤机械组成模型制图对比研究[J]. 中国土壤与肥料, 2023(6): 12-22.
Ma S H, Wang J X, Zhang R L, et al. Comparative research on mapping of soil particle composition model in piedmont alluvial sector of western Hebei[J]. Soils and Fertilizers Sciences in China, 2023(6): 12-22.
[28] 南富森, 李宗省, 张小平, 等. 基于MGWR的黄河流域土壤有机碳密度和影响因素分析[J]. 环境科学, 2023, 44(2): 912-923.
Nan F S, Li Z X, Zhang X P, et al. Spatial distribution characteristics and influencing factors of soil organic carbon density in Yellow River Basin based on MGWR model[J]. Environmental Science, 2023, 44(2): 912-923.
[29] Lamichhane S, Kumar L, Wilson B. Digital soil mapping algorithms and covariates for soil organic carbon mapping and their implications: a review[J]. Geoderma, 2019, 352: 395-413.
[30] Badgery W B, Simmons A T, Murphy B M, et al. Relationship between environmental and land-use variables on soil carbon levels at the regional scale in central New South Wales, Australia[J]. Soil Research, 2013, 51(8): 645-656.
[31] 王幼奇, 张兴, 赵云鹏, 等. 基于GIS和地理加权回归的砂田土壤阳离子交换量空间预测[J]. 土壤, 2020, 52(2): 421-426.
Wang Y Q, Zhang X, Zhao Y P, et al. Interpolation of soil CEC of sandy fields using GIS and geographically weighted regression-kriging[J]. Soils, 2020, 52(2): 421-426.
[32] 胡志瑞, 赵万伏, 宋垠先, 等. 基于改进麻雀搜索算法优化BP神经网络的土壤有机质空间分布预测[J]. 环境科学, 2024, 45(5): 2859-2870.
Hu Z R, Zhao W F, Song Y X, et al. Prediction spatial distribution of soil organic matter based on improved BP neural network with optimized sparrow search algorithm[J]. Environmental Science, 2024, 45(5): 2859-2870.
[33] Ellili Y, Walter C, Michot D, et al. Mapping soil organic carbon stock change by soil monitoring and digital soil mapping at the landscape scale[J]. Geoderma, 2019, 351: 1-8.
[34] Cortes C, Vapnik V. Support-vector networks[J]. Machine Learning, 1995, 20(3): 273-297.
[35] Vapnik V N. The nature of statistical learning theory[M]. New York: Springer, 2000.
[36] Maynard J J, Levi M R. Hyper-temporal remote sensing for digital soil mapping: characterizing soil-vegetation response to climatic variability[J]. Geoderma, 2017, 285: 94-109.
[37] 任必武, 陈瀚阅, 张黎明, 等. 机器学习用于耕地土壤有机碳空间预测对比研究——以亚热带复杂地貌区为例[J]. 中国生态农业学报(中英文), 2021, 29(6): 1042-1050.
Ren B W, Chen H Y, Zhang L M, et al. Comparison of machine learning for predicting and mapping soil organic carbon in cultivated land in a subtropical complex geomorphic region[J]. Chinese Journal of Eco-Agriculture, 2021, 29(6): 1042-1050.
[38] 宁一泓, 王海燕, 侯文宁, 等. 重庆笋溪河流域土壤有机碳特征及影响因素[J]. 森林与环境学报, 2022, 42(5): 552-560.
Ning Y H, Wang H Y, Hou W N, et al. Characteristics and influencing factors of soil organic carbon in the Sunxi River Basin, Chongqing[J]. Journal of Forest and Environment, 2022, 42(5): 552-560.
[39] 黄先飞, 周运超, 张珍明. 喀斯特石漠化区不同土地利用方式下土壤有机碳分布特征[J]. 水土保持学报, 2017, 31(5): 215-221.
Huang X F, Zhou Y C, Zhang Z M. Distribution characteristics of soil organic carbon under different land uses in a Karst Rocky Desertification Area[J]. Journal of Soil and Water Conservation, 2017, 31(5): 215-221.
[40] 杨阳, 窦艳星, 王宝荣, 等. 黄土高原土壤有机碳固存机制研究进展[J]. 第四纪研究, 2023, 43(2): 509-522.
Yang Y, Dou Y X, Wang B R, et al. Advances in soil organic carbon sequestration mechanisms on the Chinese Loess Plateau[J]. Quaternary Sciences, 2023, 43(2): 509-522.
[41] 王月娟. 富县苹果优质高产栽培技术要点[J]. 农家参谋, 2020(14): 77.
[42] 杨桦, 彭小瑜, 杨淑琪, 等. 滇南喀斯特断陷盆地土地利用方式对土壤有机碳及其活性组分的影响[J]. 生态学报, 2022, 42(17): 7105-7117.
Yang H, Peng X Y, Yang S Q, et al. Effects of land use types on soil organic carbon and soil labile organic carbon in karst faulted basin of southern Yunnan[J]. Acta Ecologica Sinica, 2022, 42(17): 7105-7117.
[43] 赵楚, 盛茂银, 白义鑫, 等. 喀斯特石漠化地区不同土地利用类型土壤氮磷有效性及其环境影响因子[J]. 应用生态学报, 2021, 32(4): 1383-1392.
Zhao C, Sheng M Y, Bai Y X, et al. Soil available nitrogen and phosphorus contents and the environmental impact factors across different land use types in typical karst rocky desertification area, Southwest China[J]. Chinese Journal of Applied Ecology, 2021, 32(4): 1383-1392.
[44] 衣鹏慧, 吴会峰, 胡保安, 等. 黄土高原地区退耕还林后土壤有机碳储量变化特征及影响因素[J]. 生态学报, 2023, 43(24): 10054-10064.
Yi P H, Wu H F, Hu B A, et al. Variation characteristics and influencing factors of soil organic carbon storage after returning farmland to forest on the Loess Plateau[J]. Acta Ecologica Sinica, 2023, 43(24): 10054-10064.
[45] 宋颖, 高明秀, 王佳凡, 等. 基于MGWR的滨海区土壤盐渍化分布空间预测及影响因素分析[J]. 环境科学, 2024, 45(7): 4293-4301.
Song Y, Gao M X, Wang J F, et al. Spatial prediction and influencing factors analysis of soil salinization in Coastal Area based on MGWR[J]. Environmental Science, 2024, 45(7): 4293-4301.
[46] 周洋, 赵小敏, 郭熙. 基于多源辅助变量和随机森林模型的表层土壤全氮分布预测[J]. 土壤学报, 2022, 59(2): 451-460.
Zhou Y, Zhao X M, Guo X. Prediction of total nitrogen distribution in surface soil based on multi-source auxiliary variables and random forest approach[J]. Acta Pedologica Sinica, 2022, 59(2): 451-460.