环境科学  2025, Vol. 46 Issue (4): 2313-2324   PDF    
基于ResNet-MHAM模型的山区耕地土壤有机质含量高光谱反演
吴建高1, 汪泓1, 张磊2, 杨隆珊1, 彭俊杰1, 龚明冲1     
1. 贵州大学矿业学院, 贵阳 550025;
2. 贵州省地质矿产勘查开发局测绘院, 贵阳 550025
摘要: 针对贵州喀斯特山区耕地土壤有机质(SOM)含量高光谱遥感预测的精度和泛化能力不足的问题, 提出了结合残差网络(ResNet)和多头注意力机制(MHAM)的一维高光谱反射数据模型(ResNet-MHAM). 首先, 采集贵州13个县市区188个土壤样品并检测光谱信息;其次, 基于不同层数(34、50、101和152层)的ResNet结构并结合MHAM进行优化构建模型;最后, 使用30%的数据集和十折交叉验证进行模型验证. 实验结果显示, 50层ResNet结构与MHAM的结合模型, 在决定系数(R2)达到0.917 2, 均方根误差(RMSE)为7.454 9 g·kg-1, 表现出优于BPNN、SVM、PLSR、GPR和RF模型的准确性和泛化能力. 研究结果为贵州山区SOM含量的高光谱预测提供了新的有效方法.
关键词: 高光谱      残差网络(ResNet)      多头注意力机制(MHAM)      土壤有机质(SOM)      山区耕地     
Hyperspectral Inversion of Soil Organic Matter Content in Mountainous Farmland Based on ResNet-MHAM Model
WU Jian-gao1 , WANG Hong1 , ZHANG Lei2 , YANG Long⁃shan1 , PENG Jun-jie1 , GONG Ming-chong1     
1. Mining College, Guizhou University, Guiyang 550025, China;
2. Institute of Surveying and Mapping, Guizhou Geology and Mineral Exploration Bureau, Guiyang 550025, China
Abstract: In response to the lack of accuracy and generalization challenges in predicting soil organic matter (SOM) content in the karst mountainous agricultural soils of the Guizhou Province using hyperspectral remote sensing, a one-dimensional hyperspectral reflectance data model, termed ResNet-MHAM, was proposed. First, soil samples from 188 locations across 13 counties and districts in Guizhou were collected, and their spectral information was analyzed. Second, the ResNet structure was optimized in combination with MHAM across different layers (34, 50, 101, and 152 layers) to construct the model presented in this study. Finally, model validation was conducted using 30% of the dataset and 10-fold cross-validation. Experimental results demonstrated that the optimized version of the model combining 50-layer ResNet structure with MHAM achieved a coefficient of determination (R2) of 0.917 2 and a root mean square error (RMSE) of 7.454 9 g·kg-1, showcasing superior accuracy and generalization capabilities compared to commonly used models such as BPNN, SVM, PLSR, GPR, and RF. These findings provide a novel and effective approach for hyperspectral prediction of SOM content in the mountainous regions of Guizhou.
Key words: hyperspectral      residual network (ResNet)      multi-head attention mechanism (MHAM)      soil organic matter (SOM)      mountainous farmland     

土壤有机质(soil organic matter, SOM)是衡量土壤肥力的关键指标, 含有对作物生长至关重要的营养元素[1, 2], 不仅能改善土壤质量, 还能促进植物生长. 因此, 准确且快速地获取SOM含量对山区耕地农业的发展至关重要. 高光谱遥感技术快速发展, 已成为估算SOM含量的有效工具. 与传统方法相比, 高光谱技术以其简便、快速、信息量丰富和无损的特点, 在精准农业中发挥着关键作用[3, 4].

基于高光谱数据估算不同地区SOM含量需要涉及光谱特征分析、数据转换、特征因子选择和建模方法等方面. 在东北地区, 一方面, 研究者通过光谱数据的分析和处理, 如利用Sentinel-2A遥感图像验证SOM含量相关性[5], 以及基于比尔朗伯定律建立土壤水分迁移的光谱校正模型[6]. 另一方面, 研究者们尝试建立不同的回归模型和优化算法, 如600 nm“弓曲率差”光谱指数与偏最小二乘回归模型, 以及动态适应度惯性加权粒子群优化算法[7, 8], 从而提高模型的全局和局部搜索能力. 同时, 还有研究关注SOM含量的空间差异和预测模型的构建, 通过分析SOM的空间分布与光谱指数和地形因子的关系[9], 提出了有效的预测模型. 也有学者利用深度学习技术, 如LeNet-5卷积神经网络模型[10], 结合无人机高光谱技术和极限梯度提升树模型[11], 成功建立高效且精准的SOM含量预测模型, 为土壤退化防治和耕地质量提升提供了科学支持[12].

在华北地区, 叶淼等[13]验证了结合连续小波变换、SHAP和极限梯度提升树在高光谱反演中的有效性. Gu等[14]利用小波变换和随机森林算法提高了耕地SOM含量的预测精度. 王延仓等[15]使用连续小波多尺度分析处理土壤光谱数据, 提高了对较低分辨率下的SOM含量的预测能力. 在西北地区, Tian等[16]运用分数阶混沌吸引子的灰色预测模型成功预测干旱区荒漠SOM含量, 有效解决光谱响应弱和模型精度低等难题. 同时, 尉芳等[17]研究影响SOM空间变异的关键因素, 确认随机森林模型在预测中表现出最高的准确性. Yang等[18]的研究发现标准正态变换和特征变量选择方法对SOM含量估算模型的精度有提升作用. 蔡海辉等[19]通过竞争自适应重加权采样法和反向传播神经网络的优化组合构建的模型准确地预测南疆SOM含量. Wei等[20]采用不同建模方法构建的基于网格搜索的自适应提升算法反演模型在不同区域展现出的最佳精度. 在中部地区, 研究者们发现基于改进麻雀搜索算法优化的反向传播神经网络在SOM含量预测中表现最好[21]. 也有利用无人机高光谱和卫星多光谱数据成功估算SOM含量[22]. 浅层卷积神经网络结构在SOM含量估算中具有优异表现, 特别是VGGNet-7模型在某些地区具备高准确性和预测能力[23]. 在东南地区, Ou等[24]提出基于库贝卡蒙克理论的厚度校正反演模型, 增强了SOM敏感光谱特征的表达. Shen等[25]还探讨土壤类型对SOM含量估算的影响, 并验证了一阶微分偏最小二乘法在此方面的有效性. 此外, 也有学者建立多波段和单波段的SOM含量估算模型, 验证了遥感技术在提高SOM含量估算准确性方面的潜力和稳定性[26].

另外, 在三江源及青藏高原地区, 有学者利用特征选择和建模方法构建SOM含量反演模型, 取得较高的相关性和精度[27]. 同时, 采用叠加集成学习算法构建大区域SOM含量反演模型, 也取得较高的决定系数和精度[28]. 针对特殊地貌如荒漠区域, Wu等[29]结合机器学习模型和光谱预处理技术构建了高精度的SOM含量反演模型, 成功利用支持向量机特征选择与随机森林相组合的模型实现了荒漠SOM含量评估[30].

不同地区的SOM含量研究采用多种技术和方法, 旨在提高模型精度和预测能力. 东北地区利用光谱数据验证相关性和建立光谱校正模型. 华北地区验证了特定技术的有效性和提高预测精度. 西北地区成功预测干旱区荒漠SOM含量, 并发现关键因素. 特殊地区构建高精度的反演模型, 实现了SOM含量评估.

虽然目前已有众多研究成果在SOM含量估算方面取得显著进展, 但在贵州省山地占比近90%, 地形复杂[31], 耕地的零碎分布和土壤类型的多样性, 给大范围的SOM含量监测带来数据重复、模型准确度下降和模型泛化能力不足的挑战, 特别是在广域SOM含量的估算中尤为明显, 使得该地区基于高光谱数据的SOM含量反演的研究相比于其他地区较少. 近年来, 残差网络和多头注意力机制在多个领域证明其准确性和泛化性具有优势, 同时也显示在解决上述问题方面的巨大潜力[32, 33].

针对这一现状, 本研究通过结合改进的残差网络与多头注意力机制组合的模型(ResNet-MHAM), 显著提升了对山区耕地SOM含量的准确性, 以期为贵州省山区耕地SOM含量的估算提供了一种有效且创新的解决方案.

1 材料与方法 1.1 研究区概况

研究区位于贵州省(24°37′~29°13′N, 103°36′~109°35′E)贵阳、遵义、黔南、黔东南和毕节等地的13个县(区、市), 属亚热带湿润季风气候, 年平均降水1 013.6 mm, 为西南高原山区地形, 地势自西向东逐渐下降. 采样点主要分布在各县的边界(图 1), 涵盖山地、丘陵和沟谷等地形的耕地, 以黄壤、黄色石灰土、水稻土和紫泥土为主, 采样点如图 1所示. 其中, 黄壤占据全省土地面积的46.4%;黄色石灰土分布最广, 且主要集中在黔中高原;92.8%的水稻土分布在海拔1 400 m以下的地区, 是贵州省农业生产中极为重要的土壤类型;相对较少的紫泥土主要分布在黔北和黔西北等高海拔地区[34].

图 1 研究区土地利用状况及土壤采样点分布示意 Fig. 1 Land use status and distribution of soil sampling sites in the study area

1.2 数据来源 1.2.1 土壤数据

于2020年8月至2021年3月, 根据贵州省的土壤空间分布特征进行土壤采样工作. 贵州山地地貌形成的土壤具有明显的垂直分布特征, 其SOM含量随土壤深度的增加而逐渐降低, 并且高含量的SOM主要集中在土壤剖面的0~20 cm深度范围内[35]. 在研究区内, 耕地表层20 cm以内的土壤被选取为样本, 采集的188个土壤样品经实验室风干、去杂和研磨后用孔径为2 mm的尼龙筛进行筛分. 每一份土样分成2份, 分别用于光谱采集和SOM含量的测定, 其SOM含量的测定采用重铬酸钾-硫酸硝化法[36]表 1).

表 1 研究区土壤样品统计特征 Table 1 Statistical characteristics of soil samples in the study area

1.2.2 高光谱数据

土壤高光谱数据通过使用ASD便携式地物波谱仪进行采集, 其波长范围为350~2 500 nm. 仪器可实现高分辨率和低分辨率的光谱采集, 其中高分辨率在700 nm波长处附近, 光谱分辨率为3 nm, 低分辨率在1 400 nm和2 100 nm波长处附近, 光谱分辨率10 nm. 实验在标准暗室条件下进行, 将土样放置在直径为15 cm和深度为2 cm的硼硅玻璃器皿内, 通过尺子刮平土壤表面, 以高密度探头自带的光源作为唯一光源, 将探头贴近土壤样品, 从探头垂直于土壤表面的方向进行光谱测量, 并在成功进行初始白板校正后, 确保高密度探头和土壤样品的相对位置保持不变. 为提高测量准确性, 将土样旋转3次, 每次的旋转角度为90°, 分别在每个土壤样本中采集10条光谱曲线[37], 在剔除异常值后取平均值作为土样的原始光谱曲线. 由于原始光谱曲线的350~400 nm和2 400~2 500 nm间存在受外界噪声影响较大的部分, 决定采用Savitzky-Golay滤波[38, 39]进行9点平滑去噪处理, 其最大特点是在滤除噪声的同时能够保持信号的形状和宽度不变. 处理后的土壤光谱曲线见图 2.

图 2 土壤样品光谱曲线 Fig. 2 Soil sample spectrum curve

1.2.3 不同土壤类型的SOM含量统计及光谱特征分析

研究区均为辣椒地, 有严格的耕作制度. 其以4个辣椒品种为主区, 以氮肥施用量为副区, 施用4种氮肥用量, 分别为0、200、350和500 g·hm-2, 按基追肥1∶1分别于播种前和初花期进行. 各处理磷肥和钾肥施肥量一致, 磷肥(P2O5)作基肥1次性施入, 施用量为150 kg·hm-2;钾肥(K2O)为300 kg·hm-2, 按基追肥1∶1进行, 追肥在初花期施用. 有机肥按照1 500 kg·hm-2用量一次性基施. 其中, 氮肥为尿素(46.4%), 磷肥为过磷酸钙(16%), 钾肥为硫酸钾(50%). 四周设保护行, 田间管理同大田生产.

本文采集的188个土壤样本中ω(SOM)最小值为8.65 g·kg-1, 最大值为198.90 g·kg-1, 平均值为32.29 g·kg-1. 研究区采集的土壤有黄色石灰土、黄泥土、紫泥土、大泥土、黄壤和水稻土共6种类型, 其SOM含量受到海拔高度和耕作制度的影响[40]. 图 3为在耕作制度影响下不同土壤类型的SOM含量与海拔分布, 可以发现, 表层SOM含量在不同土壤类型之间有显著的差异, 水稻土的SOM含量显著高于其他土类, 黄泥土、紫泥土、大泥土和黄壤的SOM含量处于中等水平, 黄色石灰土的含量较低. 不同土壤类型所处的海拔有较大差异, 紫泥土所处海拔平均值显著高于其他土壤类型, 黄泥土所处海拔平均值最低, 整体分布规律与前人的研究较为趋近[41], 这种变化可能受到土壤结构、采样分布面积、土壤类型和耕作制度等多种因素的综合影响.

图 3 不同土壤类型的SOM含量和海拔分布 Fig. 3 Distribution of SOM and altitude across different soil types

为探究不同土壤类型的SOM含量光谱反射率特征, 将每个土壤类型的光谱反射率取得平均值, 绘制曲线如图 4所示. 可以发现, 研究区不同土壤类型的SOM含量光谱反射率曲线整体变化趋势相近, 在400~800 nm区间, 反射率增长很快, 斜率较大, 而在近红外的800~2 500 nm波段, 曲线走向呈平稳趋势. 整条曲线有3个明显的波谷特征, 分别在1 350~1 450、1 850~1 050和2 150~2 250 nm, 这是由于水在可见光和近红外光谱范围内具有特定的吸收特性, 故波谷的产生很可能是水分的吸收所导致. 整体上, SOM含量较高的土壤类型呈现较低的反射率, 但从6种土壤类型的SOM含量光谱反射曲线可以看出, 并非含量越高反射率就越低, 两者之间不存在绝对的负相关性.

括号内数值为SOM含量 图 4 不同土壤类型的SOM含量光谱曲线 Fig. 4 Spectral curves of SOM in different soil types

1.3 研究方法

本研究提出的ResNet-MHAM主要包括3个步骤:首先, 将采集的贵州山区耕地土壤高光谱数据进行SG平滑处理后, 使用小波变换获取5种级别的光谱变换, 经SPXY算法进行数据集划分, 得到训练集和验证集;其次, 在34、50、101和152层的残差网络结构基础上进行改进, 每一个残差网络均加载多头注意力机制以构建4种ResNet-MHAM;最后, 基于验证集数据确定出具有高准确度和高效率的最佳ResNet-MHAM, 通过十折交叉验证和两个评价指标(决定系数和均方根误差), 证实反演模型具有良好的鲁棒性和稳健的泛化能力. 该模型以Windows10系统为基础, 使用Python 3.9.13语言编写, 配置PyTorch环境(torch-1.12.0+cu113-cp39-cp39), 集成于Pycharm 2021.3. 所有代码和数据均在Pycharm中执行操作, 使用Matlab 2020b进行数据结果可视化. 数据和模型均在GPU(NVIDIA GeForce RTX 3060)上运行, 以提高处理效率.

1.3.1 改进的残差网络

He等[42]在2015年提出残差网络(residual network, ResNet), 通过引入残差块, 可以有效解决深层网络中常见的梯度消失和梯度爆炸的问题, 使得信息更容易传播. ResNet主要是针对三维(three-dimensional, 3D)图像应用而设计的, 其不同层数的网络结构如表 2所示. 由于本文的数据是一维(one-dimensional, 1D)高光谱反射数据, 故需要对ResNet进行改进. 改进的ResNet调整原始ResNet的一些参数以适应1D高光谱反射数据, 但也保留部分原始参数(图 5), 具体改进有以下3点.

表 2 系列残差网络结构 Table 2 Series ResNet structure

图 5 所提出的残差网络结构 Fig. 5 Proposed ResNet structure

(1)在研究区的数据集中, 土壤光谱反射率涵盖350~2 500 nm的范围, 具有大小为1×2 151的特征. 在PyTorch中, 1D的ResNet的设计是(bs, dim, data_len), 其中bs为每次训练时一次处理的样本数目, dim为特征的维度, data_len为输入数据的长度. 因此, 需要将原始结构中的(bs, data_len)更改为(bs, dim, data_len), 即(bs, 1, 2151).

(2)改进的ResNet的卷积核大小应调整为1D卷积核, 其中1×n取代n×n.

(3)为预测SOM含量, 改进的ResNet的激活函数具有以下形式的线性激活函数:

(1)

式中, xi为最后一个完全连接层的输入, Fxi)为最后一次完全连接层的输出.

其他参数中, 除式(1)~(3)中提到的参数外, ResNet的其他参数直接用于本文的数据结构.

由于通过卷积层提取土壤高光谱数据的特征时, 卷积层的数量会对模型性能产生显著影响. 故根据ResNet的特点, 本文采用34、50、101和152层这4种不同的ResNet结构进行实验, 以确定出最适合进行SOM含量反演的结构.

1.3.2 多头注意力机制

注意力机制(attention mechanism, AM)是由Bahdanau等[43]于2014年提出, 该模型能够聚焦于输入数据中不同部分的能力. 多头注意力机制(multi-head attention mechanism, MHAM)是自注意力机制的一种扩展形式, 其优势在于注意力被并行地应用于数据的不同表示, 能允许模型同时学习多组注意力权重, 并产生多个加权表示, 以上表示在后续被联合或拼接, 形成更丰富和更复杂的表示. 这种机制使模型能够更好地捕捉输入中不同方面的信息, 并在更高层次上理解序列数据的关联性.

MHAM可以对ResNet的输出数据特征做进一步处理, 其计算过程如图 6所示. MHAM的加入能充分利用高光谱数据的信息, 提高模型在贵州山区耕地SOM含量反演中的准确性和适用性, 以进一步提升模型性能.

图 6 多头注意力机制计算过程 Fig. 6 MHAM calculation process

1.3.3 ResNet-MHAM

ResNet-MHAM是在对ResNet进行改进的基础上加入MHAM, 形成一种创新的反演模型. ResNet-MHAM结构如图 7所示, 模型主要包括1个改进的ResNet和1个多头注意力机制. ResNet和MHAM的权重起初进行随机化处理;ResNet将高光谱数据进行特征提取, 其输出数据中保留原始输入数据的内在特征;MHAM对ResNet的输出数据做进一步处理, 提高模型的特征学习能力;最后使用实测和预测的SOM含量来计算损失值, 并判断阈值重新加权, 以调整反向传播中每层的权重和偏差量.

图 7 本文模型反演过程 Fig. 7 ResNet-MHAM inversion process

1.3.4 模型评估方法

本研究采用十折交叉验证方法对模型进行性能评估, 使用决定系数(R2)和均方根误差(RMSE)作为评价指标. R2和RMSE计算公式如下:

(2)
(3)

式中, yi为第i个土样SOM实测值, i为第i个土样SOM预测值, yii个土样SOM实测平均值, n为所有样品的数量.

2 结果与分析 2.1 数据统计与方法

SPXY算法可以为模型选出更具代表的样本作为训练数据, 从而提高模型的反演效果, 其以SOM含量为y变量, 光谱为x变量, 利用两种变量同时计算样品间距离以保证最大程度表征样本分布, 有效地覆盖多维向量空间, 增加样本间的差异性和代表性, 提高模型的稳定性[44], 所划分的数据集见表 3. 188个样本的ω(SOM)为8.56~198.90 g·kg-1之间, 标准差为21.08 g·kg-1, 平均值为32.30 g·kg-1. 总样本集和其所划分出的两个样本集的峰度分别为KW=31.85、KT=23.95和KV=32.21;偏度分别为SW=4.90、ST=4.00和SV=5.50;以上数值显示3个统计样本具有相对较高的峰度和偏度, 这符合大范围抽取样本的实验预期. 样本的分布形状与正态分布相比具有更厚重的尾部, 为右偏. 为对模型的精度做进一步分析, 本文采用十折交叉验证法, 以验证模型具有更高的鲁棒性[45].

表 3 SOM含量统计特征 Table 3 Statistical characteristics of SOM content

2.2 SOM高光谱数据小波变换

山区耕地土壤光谱数据受到土壤质地和噪声等影响, 会影响信噪比并阻碍后续数据分析和建模效果. 为此, 本文采用小波变换对土壤光谱数据进行处理. 小波变换将信号分解成不同级别上的近似系数和细节系数, 实现信号的多尺度分析, 生成的小波系数可用于提取关键信息, 有助于挖掘出土壤光谱的特征波段, 为后续的建模提供更可靠的基础. 在本研究中, 选取5种尺度的小波变换(小波基为Haar)对土壤光谱数据进行变换, 变换结果如图 8所示. 可以发现, 当级别增大, 分解的波段数量也会随着增加, 第2级别到第5级别曲线走向大体一致, 随着级别的增大, 反射率值浮动越小, 到第5级别时, 曲线几乎趋于平稳.

(a)~(d)分别为第2级别至第5级别光谱变换, 图例与图 2一致 图 8 高光谱数据小波变换 Fig. 8 Hyperspectral data wavelet transform

2.3 最佳预测模型的确定

以2.1节和2.2节生成的训练集和验证集进行模型性能测试来确定出最佳ResNet-MHAM. 实验通过对比不同结构的ResNet-MHAM在R2和RMSE上的数据(固定模型函数和超参数:学习率为1×10-4, 训练次数为500), 得出何种结构的ResNet-MHAM在SOM含量反演上表现最优. 经测试, 在光谱变换的5个级别中, 第3级别的数据在模型的反演效果最佳, 其结果如表 4所示. 数据显示在不同ResNet结构下, ResNet-MHAM在SOM含量预测能力存在差异. 在模型训练集上, 随着层数增加, R2呈先上升后下降的趋势, RMSE趋势则与R2相反, 50-ResNet-MHAM(层数为50的ResNet结构)的效果最好(R2为0.979 8, RMSE为2.803 0 g·kg-1);在验证集上, R2和RMSE的数据特征与训练集一致, 50-ResNet-MHAM表现最好(R2为0.917 2, RMSE为7.454 9 g·kg-1). 采用十折交叉验证进行测试, 其结果如表 5所示. 数据结果走向与SPXY划分的验证集一致, R2随着层数的增加呈先上升后下降的趋势, RMSE的数据走向与R2相反, 50-ResNet-MHAM在R2和RMSE达到最佳效果, R2为0.849 2, RMSE为8.316 3 g·kg-1. 但可以发现, 在十折交叉验证方法下, 50-ResNet-MHAM的R2和RMSE相比于SPXY所划分的数据降低了0.068 0和上升了0.861 4 g·kg-1, 其原因是SPXY算法通过选择更具代表性的样本, 保持样本间的差异性和代表性, 以及更好地反映数据的特征分布, 从而在模型验证过程中表现更好, 获得更高的R2值和更低的RMSE. 图 9图 10为不同ResNet结构的ResNet-MHAM在训练集和验证集上的结果对比. 图 11为不同结构的ResNet-MHAM在十折交叉验证下的结果对比. 从数据结果可知, 随着层数的增加, 模型的精度和稳定性呈现出先上升到后下降的趋势. 其原因是结构为高层数时, ResNet-MHAM在训练中面临更加困难的问题, 包括训练的不稳定性、收敛时间的增加和更容易陷入局部极小值. 再者, 尽管高层ResNet具备更多参数以进行学习, 但与其所需的数据量相比, 本次采集的数据相对较少. 这种情况下, 高层数的结构需要更多的数据进行有效学习, 以确保其在训练集和验证集上的性能能够达到当前的精度要求, 故152-ResNet-MHAM在训练集和验证集上的表现均未能达到当前的精度要求. 同时, 过高的层数有着更复杂的结构, 相比于较低的层数, 其计算和存储需求也会显著增加, 使得训练和推理过程变得更为复杂, 导致在训练集和验证集上的性能下降. 综合考虑精确度和计算时间这2个因素, 本研究选择ResNet为50层数的ResNet-MHAM作为最佳模型. 在后续分析中, 所提到的ResNet-MHAM均指50-ResNet-MHAM.

表 4 不同残差网络结构的ResNet-MHAM在训练集和验证集的评价指标 Table 4 Training and validation sets evaluation indexes of ResNet-MHAM with different ResNet structures

表 5 不同残差网络结构的ResNet-MHAM的十折交叉验证评价指标 Table 5 ResNet-MHAM ten-fold cross validation evaluation indexes under different ResNet architectures

图 9 不同残差网络结构的ResNet-MHAM在训练集的效果对比 Fig. 9 Comparison of training effects of ResNet-MHAM combined models with different ResNet architectures

图 10 不同残差网络结构的ResNet-MHAM在验证集的效果对比 Fig. 10 Comparison of validation effects of ResNet-MHAM combined models with different ResNet architectures

图 11 不同残差网络结构的ResNet-MHAM的十折交叉验证效果对比 Fig. 11 Comparison of ten-fold cross validation effect of ResNet-MHAM combined model with different ResNet architectures

2.4 模型对比

本研究将反向传播神经网络(backpropagation neural network, BPNN)、支持向量回归(support vector machine, SVM)、偏最小二乘回归(partial least squares regression, PLSR)、随机森林(random forest, RF)和高斯过程回归(gaussian process regression, GPR)进行SOM含量预测, 所使用的数据为2.1节和2.2节生成的训练集和验证集, 最终的结果与本模型进行对比, 以客观和科学地证明ResNet-MHAM的有效性. 表 6为所有模型在验证集上的评价指标, 图 12呈现所有模型在验证集上的反演效果.

表 6 不同模型在验证集上的评价指标 Table 6 Evaluation indexes of different models on validation sets

图 12 ResNet-MHAM、BP、GPR、SVM、RF和PLSR在验证集的效果对比 Fig. 12 Comparison of the effect of the ResNet-MHAM, BP, GPR, SVM, RF and PLSR on the validation sets

通过预测结果可以看出, 在验证集中, 所有模型的决定系数(R2)由大到小依次为:ResNet-MHAM(0.917 2) > BPNN(0.861 0) > GPR(0.849 7) > SVM(0.836 3) > RF(0.750 6) > PLSR(0.542 9), 相比之下, ResNet-MHAM是唯一在R2上超过0.9的模型且SOM的实测值与预测值接近1∶1线;所有模型的均方根误差(RMSE)由小到大依次为:ResNet-MHAM(7.454 9 g·kg-1) > BPNN(10.728 7 g·kg-1) > GPR(11.030 6 g·kg-1) > SVM(11.643 6 g·kg-1) > RF(14.369 1 g·kg-1) > PLSR(19.452 9 g·kg-1), 对比之下, ResNet-MHAM是唯一在RMSE上小于10 g·kg-1的模型. 整体上看, BPNN、GPR和SVM的R2在0.80~0.90之间, 表明它们在贵州山区耕地SOM含量的预测能力表现较好;RF和PLSR的R2较低, 均低于0.8, 表明传统的RF和PLSR模型在研究区SOM含量的预测能力表现较差. ResNet-MHAM的决定系数(R2)相比于表现最好的BP提高了0.056 2, 均方根误差(RMSE)降低了3.273 8 g·kg-1. 数据表明ResNet-MHAM的SOM含量预测具有很好的精度与准确性, 可以得出ResNet-MHAM在贵州山区耕地SOM含量预测应用中的优越性.

3 讨论

贵州山地地貌发育的土壤具有明显的垂直分布特征, 不同土壤类型的成土条件和成土过程具有较大的差异, 不同耕作制度也会影响耕地土壤熟化或退化. 为此, 本文研究中, 综合考虑海拔高度、不同地区和不同土壤类型等因素进行土样采集. 本研究发现在耕作制度影响下, 不同土壤类型的表层SOM含量和海拔分布存在显著差异. 水稻土SOM含量最高, 黄色石灰土最低;紫泥土海拔最高, 黄泥土最低. 经推测, 出现上述规律, 主要是由于采集区域较为分散, 同时人为因素在相同耕作制度执行期间造成不同影响. 在不同土壤类型的SOM含量的光谱响应状况中, 其反射率曲线整体变化趋势相近, 整体上, SOM含量较高的土壤类型呈现较低的反射率, 但两者之间不存在绝对的负相关性.

目前利用高光谱遥感技术结合模型算法的预测模型在贵州山区耕地SOM含量预测领域仍存在一定的局限性, 并尚未有研究采用ResNet和MHAM这两种先进算法进行SOM含量预测. 本文的ResNet-MHAM专为处理1D高光谱反射率而设计, 将3D的ResNet结构优化为1D的ResNet结构, 既提升了计算效率, 又降低了硬件功耗和超参数复杂度. 模型设计上兼顾结构简化和性能优越的平衡, 有效避免了过拟合问题, 为模型在实际应用中的可靠性提供了保障.

经实验验证, 采用50层的ResNet结构在贵州山区耕地SOM含量预测中取得最佳性能. ResNet-MHAM在SPXY算法划分的验证集上, 与5个常用模型(BPNN、SVM、PLSR、RF和GPR)相比, R2提高了0.056 2~0.374 3, RMSE降低了3.273 8~11.998 0 g·kg-1, 表现出很高的准确性和稳定的泛化能力. 模型经十折交叉验证后, R2和RMSE仍然有着优秀的表现, 为0.849 2和8.316 3 g·kg-1, 显示出模型具有很高的鲁棒性.

本文提出的ResNet-MHAM针对贵州山区耕地SOM含量预测中面临的数据重复和预测精度偏低问题进行了有效的应对. 数据集为贵州省范围内不同类型的山区耕地SOM含量及其高光谱数据, 使得ResNet-MHAM能够更全面地考虑土壤类型和数据多样性. 这种方法有助于减弱数据重复带来的影响, 同时增强了模型对贵州山区耕地SOM含量预测的可靠性和实用性, 为高光谱遥感技术在该领域的应用提供了重要支持.

4 结论

(1)研究区不同土壤类型的ω(SOM)在8.56~198.90 g·kg-1之间, 为中等水平. 不同土壤类型的表层SOM含量和海拔分布存在显著差异, 水稻土的平均SOM含量最高(33.28 g·kg-1), 黄色石灰土最低(29.34 g·kg-1);紫泥土的平均海拔最高(1 226 m), 黄泥土最低(913 m).

(2)50层的ResNet-MHAM相较于34、101和152层在验证集和十折交叉验证上表现最优, R2分别为0.917 2和0.849 2, RMSE分别为7.454 9 g·kg-1和8.316 3 g·kg-1. 这表明在本次数据集上增加网络深度可以提高模型性能, 但过高深度会降低性能.

(3)与BPNN、SVM、PLSR、RF和GPR常用模型相比, ResNet-MHAM表现出更高的准确性和稳定的泛化能力. 这表明ResNet-MHAM有效解决了耕地零碎分布和多样的土壤类型所带来的挑战, 提高了大范围SOM含量高光谱监测的准确性和稳定性, 显示出在贵州多地区山区耕地SOM含量监测中具有良好的通用性和实用性.

参考文献
[1] Wood S A, Tirfessa D, Baudron F. Soil organic matter underlies crop nutritional quality and productivity in smallholder agriculture[J]. Agriculture, Ecosystems & Environment, 2018, 266: 100-108.
[2] 张东辉, 赵英俊, 秦凯, 等. 高光谱土壤多元信息提取模型综述[J]. 中国土壤与肥料, 2018(2): 22-28.
Zhang D H, Zhao Y J, Qin K, et al. A review of hyperspectral multivariate information extraction models for soils[J]. Soils and Fertilizers Sciences in China, 2018(2): 22-28.
[3] He S F, Zhou Q, Wang F. Local wavelet packet decomposition of soil hyperspectral for SOM estimation[J]. Infrared Physics & Technology, 2022, 125. DOI:10.1016/J.INFRARED.2022.104285
[4] 吴裕, 申广荣, 刘璐, 等. 土壤有机质高光谱特征及其反演研究[J]. 上海交通大学学报(农业科学版), 2019, 37(4): 37-44.
Wu Y, Shen G R, Liu L, et al. Hyperspectral characteristics of soil organic matter and inversion methods[J]. Journal of Shanghai Jiaotong University (Agricultural Science), 2019, 37(4): 37-44.
[5] Tang S Y, Du C, Nie T Z. Inversion estimation of soil organic matter in Songnen plain based on multispectral analysis[J]. Land, 2022, 11(5). DOI:10.3390/land11050608
[6] Ou D P, Tan K, Li J, et al. Prediction of soil organic matter by Kubelka-Munk based airborne hyperspectral moisture removal model[J]. International Journal of Applied Earth Observation and Geoinformation, 2023, 124. DOI:10.1016/J.JAG.2023.103493
[7] Chang R C, Chen Z, Wang D M, et al. Hyperspectral remote sensing inversion and monitoring of organic matter in black soil based on dynamic fitness inertia weight particle swarm optimization neural network[J]. Remote Sensing, 2022, 14(17). DOI:10.3390/rs14174316
[8] Lu W Y, Du H S, Chen Y H. Soil organic matter inversion based on imaging spectral data in straw-covered noncultivated land[J]. Journal of Sensors, 2023, 2023. DOI:10.1155/2023/7479031
[9] Pan Y, Zhang X L, Liu H J, et al. Remote sensing inversion of soil organic matter by using the subregion method at the field scale[J]. Precision Agriculture, 2022, 23(5): 1813-1835.
[10] Ma L, Zhao L, Cao L Y, et al. Inversion of soil organic matter content based on improved convolutional neural network[J]. Sensors, 2022, 22(20). DOI:10.3390/s22207777
[11] 夏晨真, 姜艳艳, 张星宇, 等. 基于无人机高光谱影像的黑土区玉米农田土壤有机质估算[J]. 光谱学与光谱分析, 2023, 43(8): 2617-2626.
Xia C Z, Jiang Y Y, Zhang X Y, et al. Estimation of soil organic matter in maize field of black soil area based on UAV hyperspectral image[J]. Spectroscopy and Spectral Analysis, 2023, 43(8): 2617-2626.
[12] 勾宇轩, 赵云泽, 李勇, 等. 基于CWT-sCARS的东北旱作农田土壤有机质高光谱反演[J]. 农业机械学报, 2022, 53(3): 331-337.
Gou Y X, Zhao Y Z, Li Y, et al. Soil organic matter content in dryland farmland in northeast China with hyperspectral reflectance based on CWT-sCARS[J]. Transactions of the Chinese Society for Agricultural Machinery, 2022, 53(3): 331-337.
[13] 叶淼, 朱琳, 刘旭东, 等. 基于连续小波变换、SHAP和XGBoost的土壤有机质含量高光谱反演[J]. 环境科学, 2024, 45(4): 2280-2291.
Ye M, Zhu L, Liu X D, et al. Hyperspectral inversion of soil organic matter content based on continuous wavelet transform, SHAP, and XGBoost[J]. Environmental Science, 2024, 45(4): 2280-2291.
[14] Gu X H, Wang Y C, Sun Q, et al. Hyperspectral inversion of soil organic matter content in cultivated land based on wavelet transform[J]. Computers and Electronics in Agriculture, 2019, 167. DOI:10.1016/j.compag.2019.105053
[15] 王延仓, 张兰, 王欢, 等. 连续小波变换定量反演土壤有机质含量[J]. 光谱学与光谱分析, 2018, 38(11): 3521-3527.
Wang Y C, Zhang L, Wang H, et al. Quantitative inversion of soil organic matter content based on continuous wavelet transform[J]. Spectroscopy and Spectral Analysis, 2018, 38(11): 3521-3527.
[16] Tian A H, Fu C B, Su X Y, et al. Estimation of low organic matter content in desert soil of arid area based on fractional order sprott chaotic circuit and gray theory[J]. IEEE Access, 2020, 8: 25001-25013. DOI:10.1109/ACCESS.2020.2970513
[17] 尉芳, 刘京, 夏利恒, 等. 陕西渭北旱塬区农田土壤有机质空间预测方法[J]. 环境科学, 2022, 43(2): 1097-1107.
Wei F, Liu J, Xia L H, et al. Spatial prediction method of farmland soil organic matter in Weibei dryland of Shaanxi province[J]. Environmental Science, 2022, 43(2): 1097-1107.
[18] Yang P M, Hu J, Hu B F, et al. Estimating soil organic matter content in desert areas using in situ hyperspectral data and feature variable selection algorithms in southern Xinjiang, China[J]. Remote Sensing, 2022, 14(20). DOI:10.3390/rs14205221
[19] 蔡海辉, 周岭, 史舟, 等. 利用CARS-BPNN模型的南疆枣园土壤有机质高光谱反演[J]. 光谱学与光谱分析, 2023, 43(8): 2568-2573.
Cai H H, Zhou L, Shi Z, et al. Hyperspectral inversion of soil organic matter in jujube orchard in southern Xinjiang using CARS-BPNN[J]. Spectroscopy and Spectral Analysis, 2023, 43(8): 2568-2573.
[20] Wei L F, Yuan Z R, Wang Z X, et al. Hyperspectral inversion of soil organic matter content based on a combined spectral index model[J]. Sensors, 2020, 20(10). DOI:10.3390/s20102777
[21] 胡志瑞, 赵万伏, 宋垠先, 等. 基于改进麻雀搜索算法优化BP神经网络的土壤有机质空间分布预测[J]. 环境科学, 2024, 45(5): 2859-2870.
Hu Z R, Zhao W F, Song Y X, et al. Prediction spatial distribution of soil organic matter based on improved BP neural network with optimized sparrow search algorithm[J]. Environmental Science, 2024, 45(5): 2859-2870.
[22] Sun M Y, Li Q, Jiang X Z, et al. Estimation of soil salt content and organic matter on arable land in the Yellow River delta by combining UAV hyperspectral and Landsat-8 multispectral imagery[J]. Sensors, 2022, 22(11). DOI:10.3390/s22113990
[23] 钟亮, 郭熙, 国佳欣, 等. 基于不同卷积神经网络模型的红壤有机质高光谱估算[J]. 农业工程学报, 2021, 37(1): 203-212.
Zhong L, Guo X, Guo J X, et al. Hyperspectral estimation of organic matter in red soil using different convolutional neural network models[J]. Transactions of the Chinese Society of Agricultural Engineering, 2021, 37(1): 203-212.
[24] Ou D P, Tan K, Wang X, et al. Modified soil scattering coefficients for organic matter inversion based on Kubelka-Munk theory[J]. Geoderma, 2022, 418. DOI:10.1016/j.geoderma.2022.115845
[25] Shen Q, Zhang S W, Xia K. Spectral heterogeneity analysis and soil organic matter inversion across differences in soil types and organic matter content in dryland farmland in China[J]. Sustainability, 2023, 15(23). DOI:10.3390/su152316310
[26] Xie R, Xiao H H. Application of remote sensing in the estimation of soil organic matter content[J]. Chemical Engineering Transactions, 2018, 66: 469-474.
[27] Zhou W, Xiao J Y, Li H R, et al. Soil organic matter content prediction using Vis-NIRS based on different wavelength optimization algorithms and inversion models[J]. Journal of Soils and Sediments, 2023, 23(6): 2506-2517.
[28] Wu M H, Dou S, Lin N, et al. Estimation and mapping of soil organic matter content using a stacking ensemble learning model based on hyperspectral images[J]. Remote Sensing, 2023, 15(19). DOI:10.3390/rs15194713
[29] Wu M J, Huang Y Q, Zhao X, et al. Effects of different spectral processing methods on soil organic matter prediction based on VNIR-SWIR spectroscopy in karst areas, southwest China[J]. Journal of Soils and Sediments, 2024, 24(2): 914-927.
[30] 张智韬, 劳聪聪, 王海峰, 等. 基于FOD和SVMDA-RF的土壤有机质含量高光谱预测[J]. 农业机械学报, 2020, 51(1): 156-167.
Zhang Z T, Lao C C, Wang H F, et al. Estimation of desert soil organic matter through hyperspectral based on fractional-order derivatives and SVMDA-RF[J]. Transactions of the Chinese Society for Agricultural Machinery, 2020, 51(1): 156-167.
[31] 贾文涛. 从土地整治向国土综合整治的转型发展[J]. 中国土地, 2018, 37(5): 16-18.
[32] Zhao W, Wu Z, Yin Z, et al. Attention-Based CNN ensemble for soil organic carbon content estimation with spectral data[J]. IEEE Geoscience and Remote Sensing Letters, 2022, 19: 1-5.
[33] Moreno-Pino F, Olmos P M, Artés-Rodríguez A. Deep autoregressive models with spectral attention[J]. Pattern Recognition, 2023, 133. DOI:10.1016/j.patcog.2022.109014
[34] 邸欣月, 安显金, 董慧, 等. 贵州喀斯特区域土壤有机质的分布与演化特征[J]. 地球与环境, 2015, 43(6): 697-708.
Di X Y, An X J, Dong H, et al. The distribution and evolution of soil organic matter in the karst region, Guizhou province, southwestern China[J]. Earth and Environment, 2015, 43(6): 697-708.
[35] 尚斌, 邹焱, 徐宜民, 等. 贵州中部山区植烟土壤有机质含量与海拔和成土母质之间的关系[J]. 土壤, 2014, 46(3): 446-451.
Shang B, Zou Y, Xu Y M, et al. Relationship between SOM contents of tobacco fields and elevation and parent materials in central region of Guizhou province[J]. Soils, 2014, 46(3): 446-451.
[36] 郝冠军, 黄懿珍, 赵晓艺, 等. 重铬酸钾外加热法测定土壤有机质的不确定度评定[J]. 上海农业学报, 2011, 27(3): 103-109.
Hao G J, Huang Y Z, Zhao X Y, et al. Evaluation of uncertainty in determining soil organic matter by potassium dichromate heating method[J]. Acta Agriculturae Shanghai, 2011, 27(3): 103-109.
[37] 肖艳, 辛洪波, 王斌, 等. 基于小波变换和连续投影算法的黑土有机质含量高光谱估测[J]. 国土资源遥感, 2021, 33(2): 33-39.
Xiao Y, Xin H B, Wang B, et al. Hyperspectral estimation of black soil organic matter content based on wavelet transform and successive projections algorithm[J]. Remote Sensing for Land and Resources, 2021, 33(2): 33-39.
[38] Xu P F, Jia Y J, Jiang M X. Blind audio source separation based on a new system model and the Savitzky-Golay filter[J]. Journal of Electrical Engineering, 2021, 72(3): 208-212.
[39] 郭云鹏, 张弓, 侯至丞, 等. 采用SG平滑滤波的Stewart平台主从控制研究[J]. 自动化仪表, 2019, 40(2): 30-33, 38.
Guo Y P, Zhang G, Hou Z C, et al. Research on master-slave control of Stewart platform using SG smoothing filter[J]. Process Automation Instrumentation, 2019, 40(2): 30-33, 38.
[40] 沈亚婷, 张巍, 何霄嘉. 土壤有机质垂直分布特征及其对短期植被更替的响应[J]. 中国环境科学, 2024, 48(8): 4520-4529.
Shen Y T, Zhang W, He X J. Vertical distribution characteristics of soil organic matter and its response to short-term vegetation succession[J]. China Environmental Science, 2024, 48(8): 4520-4529.
[41] 文鑫, 王艺惠, 钟聪, 等. 贵州表层土壤有机质空间变异特征及其影响因素分析[J]. 水土保持学报, 2023, 37(3): 218-224.
Wen X, Wang Y H, Zhong C, et al. Spatial variation of surface soil organic matter and its influencing factors in Guizhou province[J]. Journal of Soil and Water Conservation, 2023, 37(3): 218-224.
[42] He K M, Zhang X Y, Ren S Q, et al. Deep residual learning for image recognition[A]. In: Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition[C]. Las Vegas, NV, USA: IEEE, 2016. 770-778.
[43] Bahdanau D, Cho K, Bengio Y. Neural machine translation by jointly learning to align and translate[J]. Arxiv Preprint Arxiv, 2014. DOI:10.48550/arXiv.1409.0473
[44] 王世芳, 韩平, 崔广禄, 等. SPXY算法的西瓜可溶性固形物近红外光谱检测[J]. 光谱学与光谱分析, 2019, 39(3): 738-742.
Wang S F, Han P, Cui G L, et al. The NIR detection research of soluble solid content in watermelon based on SPXY algorithm[J]. Spectroscopy and Spectral Analysis, 2019, 39(3): 738-742.
[45] Geisser S. A predictive approach to the random effect model[J]. Biometrika, 1974, 61(1): 101-107.