环境科学  2023, Vol. 44 Issue (6): 3619-3626   PDF    
基于机器学习方法的小麦镉富集因子预测
牛硕1,2, 李艳玲3, 杨阳2, 商艳萍4, 王天齐2, 陈卫平2     
1. 郑州大学河南先进技术研究院, 郑州 450003;
2. 中国科学院生态环境研究中心城市与区域生态国家重点实验室, 北京 100085;
3. 中交天津航道局有限公司天津市疏浚工程技术企业重点实验室, 天津 300461;
4. 河南省济源市种子管理站, 济源 459000
摘要: 应用机器学习方法解析区域土壤-小麦系统镉(Cd)富集特征有助于风险决策的准确性和科学性.基于区域调查, 构建了Freundlich-type转移方程、随机森林(RF)模型和神经网络(BPNN)模型对小麦Cd富集因子(BCF-Cd)进行预测, 验证不同模型的预测精度并评估其不确定性.结果表明, RF (R2=0.583)和BPNN (R2=0.490)模型预测性能均优于Freundlich转移方程(R2=0.410).重复训练结果显示RF和BPNN平均绝对误差(MAE)和均方根误差(RMSE)较为接近, 但RF (R2为0.527~0.601)较BPNN (R2为0.432~0.661)模型精度和稳定性更高.特征变量重要性分析显示多重因素的共同作用导致小麦BCF-Cd的异质性, 其中土壤磷(P)和锌(Zn)是影响小麦, 变化的关键变量, 参数优化可进一步提高, 模型精度, 稳定性和泛化能力。
关键词: 随机森林      神经网络      回归方程      富集系数      小麦     
Prediction of Cadmium Uptake Factor in Wheat Based on Machine Learning
NIU Shuo1,2 , LI Yan-ling3 , YANG Yang2 , SHANG Yan-ping4 , WANG Tian-qi2 , CHEN Wei-ping2     
1. Henan Institutes of Advanced Technology, Zhengzhou University, Zhengzhou 450003, China;
2. State Key Laboratory of Urban and Regional Ecology, Research Center for Eco-Environmental Sciences, Chinese Academy of Sciences, Beijing 100085, China;
3. Tianjin Key Laboratory for Dredging Engineer Enterprises, China Communications Construction Company Tianjin Dredging Co., Ltd., Tianjin 300461;
4. Henan Jiyuan County Seed Management Station, Jiyuan 459000, China
Abstract: Applying machine learning methods to resolve the cadmium (Cd) uptake characteristics of regional soil-wheat systems can contribute to the accuracy and rationality of risk decisions. Based on a regional survey, we constructed a Freundlich-type transfer equation, random forest (RF) model, and neural network (BPNN) model to predict wheat Cd enrichment factor (BCF-Cd); verified the prediction accuracy; and assessed the uncertainty of different models. The results showed that both RF (R2=0.583) and BPNN (R2=0.490) were better than the Freundlich transfer equation (R2=0.410). The RF and BPNN were further trained repeatedly, and the results showed that the mean absolute error (MAE) and root mean square error (RMSE) of RF and BPNN were close to each other. Additionally, the accuracy and stability of RF (R2=0.527-0.601) was higher than that of BPNN (R2=0.432-0.661). Feature importance analysis showed that multiple factors led to the heterogeneity of wheat BCF-Cd, in which soil phosphorus (P) and zinc (Zn) were the key variables affecting the change in wheat BCF-Cd. Parameter optimization can further improve the accuracy, stability, and generalization ability of the model.
Key words: random forest      neural network      regression equation      uptake factors      wheat     

我国农田土壤镉(Cd)污染形势严峻[1].近年来, 我国西北[2]、华北[3]和华东[4]等地均相继出现小麦Cd含量超标现象.有研究指出矿区周边农田土壤Cd超标率达100%[5].准确预测区域小麦籽粒Cd富集风险对于保障农产品质量安全和维护民众健康尤为重要.

小麦Cd富集因子(BCF-Cd, 小麦籽粒Cd含量与土壤Cd含量的比值)和多元回归模型的联用来初步量化Cd从土壤进入小麦的转移过程, 近年来在农田Cd污染风险管理方面应用较多[5~7].然而, 小麦Cd富集过程强度低, 周期长, 影响因素繁杂, 传统的多元回归模型无法准确预测BCF-Cd变化趋势, 且缺乏普适性, 难以推广应用[8~10].通过大样本数据训练的机器学习方法可实现对目标变量的高精度预测, 在面对复杂系统中自变量和因变量的非线性关系以及处理多维特征数据集时均表现出较大潜力[11~16].Palansooriya等[11]通过神经网络和随机森林方法评估了生物炭应用下土壤重金属固定效率.Li等[10]基于卷积神经网络(CNN)开发了土壤-水稻系统中水稻重金属含量预测模型, 并指出该模型精度显著优于多元线性回归和贝叶斯岭回归方法.Hou等[17]通过遗传算法-神经网络(GA-BPNN)对区域稻米Cd富集量进行了预测, 并对影响因子进行了评估.然而该类机器学习方法在北方碱性小麦田的应用研究相对较少, 模型精度和不确定性仍不明确.

本文选取河南省济源麦田为研究区, 结合区域调查的土壤-小麦系统采样数据, 应用多元线性回归模型、随机森林(RF)和神经网络(BPNN)模型, 解析区域土壤-小麦系统Cd富集特征, 预测小麦BCF变化趋势并评估不同模型准确性和不确定性, 优化模型参数, 以期为我国小麦Cd污染防治提供技术支撑.

1 材料与方法 1.1 研究区概况

研究区(112°30′~112°45′E、35°00′~35°10′N)位于河南省西北部, 总面积363 km2, 总人口约67.6万, 周围分布有在产大型有色金属矿场和冶炼基地, 为当地产业和人口聚集区.主要土壤类型为潮土和褐土, 土壤pH范围在6.07~8.16.主要种植作物有冬小麦、玉米和大豆等, 为济源市粮食主产区.土壤Cd主要来源为大气沉降和废水灌溉, 约占贡献源的82.7%[7].

1.2 数据获取

本研究在济源市(112°01′~112°45′E、34°53′~35°16′N)进行大面积野外区域调查, 并设置206个采样点.利用五点取样法分别采取相应小麦和表层土壤(0~20 cm)样品, 样点分布详细情况见图 1.采集后的土壤样品密封存于自封袋中带回, 经风干过筛(0.15 mm)后密封保存备用.小麦样品经自来水洗净后剪去麦穗, 用去离子水洗净, 105℃杀青30 min, 60℃烘干至恒重, 脱壳后研磨粉碎.土壤pH、阳离子交换量(CEC)和土壤有机质(SOM)等土壤基本性质分析测试方法详见文献[18], 应用四酸法(HCl-HNO3-HF-HClO4)消解土壤样品, HNO3-HClO4消解小麦样品, CaCl2溶液浸提土壤有效态Cd(0.01 mol·L-1, 固液比1 ∶2)[7].

图 1 研究区概况及采样点分布示意 Fig. 1 Location of the study area and distribution of sampling sites

应用ICP-OES(PerkinElmer Optima 8300, USA)测定样品K、Na、P、Ca、Zn、Cu、Fe、Mn、Mg和Al含量, 应用ICP-MS(Agilent 7500a, USA)测定样品Cd和Pb含量.使用国家标准物质(GBW 10046河南小麦; GBW 07427华北平原土壤)进行质量控制, 测得空白加标回收率在86.5% ~109%. 14组选取变量分析结果如下:土壤pH为7.66±0.328、土壤阳离子交换量(CEC)为(16.2±3.96)cmol·kg-1、土壤有机质(SOM)为(27.0±5.75)g·kg-1、土壤ω(Ca)为(26 479±16 102)mg·kg-1、土壤ω(Mg)为(11 984±4 328)mg·kg-1、土壤ω(K)为(19 519±2 739)mg·kg-1、土壤ω(Na)为(10 649±2 476)mg·kg-1、土壤ω(Fe)为(29 196±4 762)mg·kg-1、土壤ω(Al)为(55 977±8 049)mg·kg-1、土壤ω(P)为(764±263)mg·kg-1、土壤ω(Zn)为(88.7±29.5)mg·kg-1、土壤ω(Cu)为(30.7±15.6)mg·kg-1、土壤ω(Mn)为(561±83.0)mg·kg-1和土壤ω(Pb)为(108±124)mg·kg-1.土壤-小麦系统Cd含量参见表 1.

表 1 土壤-小麦系统Cd含量特征1) Table 1 Cd concentration in soil-wheat system

1.3 模型

以小麦BCF-Cd量化土壤-小麦Cd富集过程.Freundlich-type方程的变形公式用于分析Cd在土壤-小麦系统的迁移特征.

(1)
(2)

式中, Cd-P为小麦籽粒Cd含量, Cd-S为土壤Cd全量, ai为各特征变量回归系数, xi为特征变量.

随机森林(RF)模型是Breiman提出的基于决策树的集成学习算法, 利用bootstrap自助采样法, 重复性有放回的采取部分样本进行训练并通过投票或平均的方式选取最优模型[12].本研究中将2017和2018年的206个样本混合作为数据集进行后续分析.RF模型通过随机抽样, 抽取数据集15%样本作为模型测试集, 余下的85%数据为训练集, 训练集通过K折验证(K=10)的方法, 分成10组数据(其中1组为验证集), 分别连续进行10次训练.随机森林决策树数量为400, 最大深度为7.

神经网络(BPNN)模型相较于传统模型无需事先确定输入变量和输出变量的映射函数, 其可通过自身训练, 不断学习最终可得到最接近期望值的结果[13].模型结构包括输入层、隐藏层和输出层.本研究中BPNN模型中输出层神经元个数为1, 输入层神经元个数为13个, 与输入变量一致.通过不断矫正模型最终设置13个隐藏层, 每个隐藏层设置20个神经元, 每层的正向传播为Linear全连接函数, 激活函数为SiLu函数, 并添加Dropout函数防止过拟合[19].梯度下降方法为自适应梯度方法(AdamW), 设置学习率为0.01, 模型迭代500次后趋于稳定.数据集划分与RF模型一致, 抽取15%样本作为模型测试集, 余下85%样本为训练集.

3种模型的性能评价指标选取决定系数(R2), 均方误差(RMSE)和平均绝对误差(MAE).特征重要性利用随机森林解释器中节点不纯度基尼系数(Gini)计算, 特征变量xi的重要性为决策树节点分支前后基尼指数变化量的归一化数值[12, 15].

(3)
(4)
(5)
(6)
(7)
(8)

式中, xi为样本, AT为隐藏层矩阵, 即正向传播中样本特征变量的权重, b为偏置, ypi为目标变量的预测值, yi为目标变量观测值, t为决策树分支节点, p2(k|t)为估计类别的概率, 即从节点t中随机抽取两个样本, 其类别标记不一致的概率.

1.4 数据分析

数据分析通过Python 3.9实现, RF通过sklearn包中的函数搭建, BPNN通过pytorch.nn包中的函数搭建, 可视化过程通过matplotlib包和OriginPro 2022b实现.

2 结果与讨论 2.1 土壤-小麦系统污染特征

研究区土壤pH在6.07~8.37之间, 平均值为7.66, 其中大部分采样点(94.7%)土壤pH均显碱性, 与河南省第二次普查数据相比[20](pH=7.70)变化不大.据表 1可知, 区域土壤ω(Cd)变化幅度较大(0.202~20.7 mg·kg-1), 变异系数(CV)高达144%.土壤ω(Cd)平均值为(1.52±2.19)mg·kg-1, 是当地土壤背景值(0.073 mg·kg-1)的20.8倍, 72.3%的土壤样品ω(Cd)高于风险筛选值(0.6 mg·kg-1), 11.2%的采样点土壤ω(Cd)超过风险管控值(3 mg·kg-1, GB 15618-2018)[21].以0.01 mol·L-1 CaCl2浸提的区域土壤ω(有效态Cd)范围为0.000 5~2.15 mg·kg-1, 平均值为0.084 mg·kg-1.土壤Cd活性系数(AR, 有效态Cd与土壤Cd含量的百分比)平均值为5.24%, 与华东地区矿区周边农田土壤相似(5.48%)[22].研究区小麦ω(Cd)平均值为(0.198±0.201) mg·kg-1(表 1), 为国家粮食安全标准(0.1 mg·kg-1, GB 2762-2022)[23]的2倍, 超标率为58.3%.可见区域土壤-小麦系统Cd迁移风险较高, 小麦Cd富集水平显著.

小麦Cd富集系数(BCF-Cd)可以量化Cd在土壤-小麦的转移过程, 表征小麦吸收积累Cd的能力[6].研究区BCF-Cd范围为0.045~0.405, 平均值为0.146±0.06, 中值为0.134, 变异系数为40.4%.应用Gaussian分布方程对小麦BCF-Cd进行拟合(图 2), 拟合结果显著(P < 0.001), 可决系数高达0.95, 可见区域BCF-Cd服从自然对数正态分布.应用Gaussian分布方程进一步对中国和美国小麦BCF-Cd进行拟合, 结果显示研究区BCF-Cd显著低于美国(平均值为3.98±5.29, 中值为1.96, 图 2), 中国-大田小麦BCF-Cd(平均值为0.280±0.350, 中值为0.190)和中国-温室小麦BCF-Cd(平均值为0.433±0.215, 中值为0.438)与本研究累积分布更为相似, 研究区BCF-Cd在模型预测领域较为典型, 可为其他小麦种植区Cd富集研究提供一定参考.

美国数据来自文献[24], 中国-大田和中国-温室数据分别来自文献[25]和文献[26, 27] 图 2 小麦Cd富集因子累积分布特征 Fig. 2 Cumulative probability distributions of the Cd BCF for wheat

2.2 BCF预测模型

相关分析显示小麦Cd富集系数(BCF-Cd)与土壤P(r=-0.432**)、Zn(r=-0.324**)、Fe(r=-0.286**)、Mn(r=-0.282**)、CEC(r=-0.236**)和K(r=-0.227**)均呈显著负相关(**表示P < 0.01下显著性水平).应用Freundlich-type转移方程进一步对各变量进行解析.结果显示(表 2), 单一变量对BCF的解释率较低[方程式(9)], 而引入土壤P后模型对小麦BCF解释率为0.247[方程式(10)], 引入土壤Zn、Na、Mn和Ca等土壤因子后, R2显著提高至0.410[方程式(11)].其他土壤因子与BCF-Cd之间没有显著性.

表 2 不同预测模型的性能 Table 2 Performance of different prediction models

将特征变量(n=13, 参见1.2节的数据获取)纳入机器学习模型[由于土壤有机质和阳离子交换量具有较强共线性, 且土壤有机质空间异质性较弱(CV=21.3%), 所以将土壤有机质剔除], 分别构建随机森林模型(RF)和神经网络模型(BPNN), 对小麦BCF-Cd变化特征进行解析.结果显示, 与最优多元回归模型相比[R2=0.410, 方程式(11)], RF模型(R2=0.583)和BPNN模型(R2=0.490)均取得了相对较高的预测效果, 且RF模型预测精度优于BPNN模型(图 3).此外, RF模型(RMSE=0.035)和BPNN模型(RMSE=0.039)的均方误差都达到了较低水平, 显著低于多元回归模型(RMSE=0.135, 图 3).Li等[10]研究发现利用卷积神经网络(CNN)预测水稻Cd含量时(R2=0.82), 预测精度显著高于多元线性回归(R2=0.52).Yang等[28]研究指出在预测土壤对Cd吸附性能时, 随机森林模型(R2=0.720)和神经网络模型(R2=0.563)预测性能均优于线性回归(R2=0.385).于灏等[9]利用神经网络模型分别对小麦和水稻Cd含量进行预测, 发现神经网络模型在水稻和小麦中的预测结果均优于多元线性回归.这些结果与本研究相似, 均表明神经网络和随机森林模型表现更为可靠, 有较大应用潜力.

图 3 不同模型对BCF观测值和预测值 Fig. 3 BCF observations and predictions for different models

进一步对RF和BPNN模型进行100次训练, 分别得出每次训练之后测试集的R2、RMSE和MAE(图 4).结果显示, RF模型预测稳定性优于BPNN模型.具体而言, RF模型R2稳定在0.527~0.601, 而BPNN模型R2在0.432~0.661之间, 两种模型MAE和RMSE相当, RF模型表现略优于BPNN模型(图 4).总体而言, RF和BPNN模型对BCF的预测优于多元回归模型, 这主要是因为两种模型均可以看作黑箱模型, 特征变量之间通过较多元线性回归更为复杂的交互作用来预测目标变量, 并能够处理复杂模糊的映射关系[28], 而不需要准确反映变量之间的关系[10].此外, RF模型在模型精度和稳定性方面要更优于BPNN模型, 这可能是因为BPNN模型容易产生局部最优解, 使得每次训练结果相差较大.Hou等[17]通过引入遗传算法(GA-BPNN)得到了较BPNN模型更加准确的结果, 其可能原因就是遗传算法在寻找全局最优方面具有优势.

图 4 重复100次训练过程的模型稳定性评价 Fig. 4 Evaluation of the stability of the model with 100 repetitions of the training process

2.3 特征变量重要性

应用RF解释器对特征变量重要性进行排序, 结果如图 5所示.磷(P)是影响BCF-Cd预测最重要的特征变量, 其重要性为0.249.Hu等[29]研究发现施用P肥等肥料对农田土壤Cd的贡献率高达30.8%.Wiggenhauser等[30]通过同位素标记法分析了P肥和土壤Cd的来源, 发现土壤常年连续施用P肥会导致土壤残留Cd库的积累.Chen等[31]通过模型模拟发现土壤Cd含量会随着P肥施用逐年增加, 进而增加作物Cd超标风险.此外, Grant等[32]发现土壤施P可能增加了土壤溶液离子强度从而减小土壤对Cd的固定; 而Yazici等[33]通过控制实验发现土壤施P改变了小麦根部生长环境, 抑制根际土壤和小麦根部的菌根定植从而增加了小麦Cd累积.而高施P量也会导致小麦对Zn的吸收减小和小麦体内Zn失衡[34], 促进小麦Cd累积.可见长期施用P肥会增加小麦籽粒Cd超标风险, 需根据区域土壤Cd污染状况进行剂量调整.

图 5 特征变量对于BCF的重要性 Fig. 5 Importance of feature variables for BCF

Zn的重要性为0.153排在第2位(图 5).Zn与Cd化学性质相似, 在小麦吸收转运过程中共用相同转运体, 存在一定交互作用[35].一般而言, Zn与Cd存在广泛的拮抗作用[36], 即土壤施Zn会抑制小麦Cd累积.然而另有研究发现土壤Zn/Cd存在使小麦籽粒Cd降至最低的阈值[37], 特别是土壤高Zn含量往往会促进小麦吸收Cd, 表现出协同作用[38].土壤Mg和Ca的重要性分别为0.133和0.084(图 5).Ca和Mg也可与Cd竞争小麦根膜表面的吸附点位, 降低小麦籽粒Cd累积[39].土壤pH值通过影响土壤水合氧化物、黏土矿物和有机质表面负电荷数量, 来影响土壤Cd生物有效性[40].然而区域土壤pH变化较小, 小麦种植环境相对稳定, 很难通过调节pH提升小麦降Cd效果.其余特征变量主要通过间接作用影响小麦籽粒BCF-Cd.

2.4 模型不确定性

重要性较低的参数和多组输入参数会降低模型的泛化能力和计算效率[9, 29].通过特征重要性分析(图 5), 进一步筛选重要性较高(重要性>0.05)的特征变量(P、Zn、Mg、Ca、CEC和Mn)进行模型优化, 并对减少特征变量前后的两种模型进行比对.结果显示(图 6), 剔除掉一些特征变量之后, RF和BPNN模型R2均有一定程度降低, 其中BPNN模型R2由0.490降至0.452, RF模型则由0.583降至0.549[图 6(a)].然而RF和BPNN模型均没有表现出明显的性能下降[图 6(a)]; 且模型绝对误差较为吻合, 没有出现明显偏离的情况[绝对误差在±0.05附近, 图 6(b)].可见本研究所构建的模型稳定性较高, 具有较高可信度.

(6)和(13)表示模型输入变量的数量, (b)中虚线表示绝对误差区间 图 6 保留重要特征变量后模型性能对比 Fig. 6 Comparison of model performance after retaining important feature variables

模型数据结构和输入参数选取也会增加模型不确定性[13].Li等[7]通过PMF受体模型和矩阵分解模型量化了该区域区位因素对土壤Cd贡献的空间分布, 结果显示大气沉降是研究区土壤Cd主要来源; 工厂分布、地形地势和盛行风向等因素导致区域土壤Cd含量分布存在较强的空间异质性, 进而通过影响模型数据结构增加模型不确定性.除此以外, 本研究忽略的土壤水分和有机质等变量可能也会影响模型不确定性.土壤水分通过改变土壤氧化还原状态从而影响土壤胶体中CdS和CdSO4的转化过程[41, 42], 进而影响小麦Cd富集.土壤有机质对Cd的络合作用能使Cd转变为相对稳定形态(降低交换态Cd, 增加有机结合态Cd含量)[43], 从而间接影响小麦对Cd富集.综上可知, RF和BPNN模型能够充分利用现有大数据集进行数据解析, 人为干扰低, 相较于传统的多元线性回归模型其适用性更加广泛, 具有较大的应用潜力.模型参数和数据结构会给机器学习模型造成一定的不确定性, 但参数的筛选和模型优化可进一步提高模型的泛化能力和算力, 且使模型能够适应具有更多样点的数据集以及更广泛的研究区, 有利于区域Cd污染农田修复和风险管理的科学决策.

3 结论

研究区土壤-小麦Cd累积风险较高, 小麦Cd富集水平显著.小麦Cd富集因子(BCF-Cd)累积分布具有一定代表性, 对其他地区BCF-Cd预测有一定参考价值.相较于多元线性回归模型, 随机森林(RF)和神经网络(BPNN)模型均能够起到更加精确的预测效果, 而RF相较BPNN模型运行更加稳定和准确.特征重要性分析显示土壤P和Zn是影响小麦Cd富集能力最重要的两个影响因子.总体看来, RF模型在预测小麦BCF-Cd时更具优势, 为土壤-小麦系统BCF-Cd预测提供了新的视角和解决方案.未来通过筛选重要性较高的特征变量可进一步增加模型可靠性, 为小麦Cd污染的精细化治理提供指导和帮助.

参考文献
[1] 徐建明, 孟俊, 刘杏梅, 等. 我国农田土壤重金属污染防治与粮食安全保障[J]. 中国科学院院刊, 2018, 33(2): 153-159.
Xu J M, Meng J, Liu X M, et al. Control of heavy metal pollution in farmland of China in terms of food security[J]. Bulletin of Chinese Academy of Sciences, 2018, 33(2): 153-159.
[2] Li Y P, Wang S L, Nan Z R, et al. Accumulation, fractionation and health risk assessment of fluoride and heavy metals in soil-crop systems in northwest China[J]. Science of the Total Environment, 2019, 663: 307-314. DOI:10.1016/j.scitotenv.2019.01.257
[3] Cai K, Zhang M J, Yu Y Q, et al. Pollution, source, and relationship of trace metal(loid)s in soil-wheat system in Hebei plain, Northern China[J]. Agronomy, 2019, 9(7). DOI:10.3390/agronomy9070391
[4] Ran J, Wang D J, Wang C, et al. Heavy metal contents, distribution, and prediction in a regional soil-wheat system[J]. Science of the Total Environment, 2016, 544: 422-431. DOI:10.1016/j.scitotenv.2015.11.105
[5] Xing W Q, Zhang H Y, Scheckel K G, et al. Heavy metal and metalloid concentrations in components of 25 wheat (Triticum aestivum) varieties in the vicinity of lead smelters in Henan province, China[J]. Environmental Monitoring and Assessment, 2016, 188(1). DOI:10.1007/s10661-015-5023-3
[6] McBride M B, Shayler H A, Spliethoff H M, et al. Concentrations of lead, cadmium and barium in urban garden-grown vegetables: the impact of soil variables[J]. Environmental Pollution, 2014, 194: 254-261. DOI:10.1016/j.envpol.2014.07.036
[7] Li Y L, Chen W P, Yang Y, et al. Quantifying source-specific intake risks of wheat cadmium by associating source contributions of soil cadmium with human health risk[J]. Ecotoxicology and Environmental Safety, 2021, 228. DOI:10.1016/j.ecoenv.2021.112982
[8] Li C, Zhang C S, Yu T, et al. Use of artificial neural network to evaluate cadmium contamination in farmland soils in a karst area with naturally high background values[J]. Environmental Pollution, 2022, 304. DOI:10.1016/j.envpol.2022.119234
[9] 于灏, 苏智杰, 祝培甜, 等. 水稻、小麦与土壤中重金属Cd含量的关系模拟研究[J]. 地学前缘, 2021, 28(1): 438-445.
Yu H, Su Z J, Zhu P T, et al. Relationship between Cd contents in rice or wheat and soil: insight from a simulation study[J]. Earth Science Frontiers, 2021, 28(1): 438-445.
[10] Li P P, Hao H J, Mao X G, et al. Convolutional neural network-based applied research on the enrichment of heavy metals in the soil-rice system in China[J]. Environmental Science and Pollution Research, 2022, 29(35): 53642-53655. DOI:10.1007/s11356-022-19640-x
[11] Palansooriya K N, Li J, Dissanayake P D, et al. Prediction of soil heavy metal immobilization by biochar using machine learning[J]. Environmental Science & Technology, 2022, 56(7): 4187-4198.
[12] Zhong S F, Zhang K, Bagheri M, et al. Machine learning: New ideas and tools in environmental science and engineering[J]. Environmental Science & Technology, 2021, 55(19): 12741-12754.
[13] Gupta S, Aga D, Pruden A, et al. Data analytics for environmental science and engineering research[J]. Environmental Science & Technology, 2021, 55(16): 10895-10907.
[14] Qian Y G, Zhou W Q, Yan J L, et al. Comparing machine learning classifiers for object-based land cover classification using very high resolution imagery[J]. Remote Sensing, 2015, 7(1): 153-168.
[15] Li Y P, Du Y, Deng Y M, et al. Predicting the spatial distribution of phosphorus concentration in quaternary sedimentary aquifers using simple field parameters[J]. Applied Geochemistry, 2022, 142. DOI:10.1016/j.apgeochem.2022.105349
[16] Fu T T, Zhao R Y, Hu B F, et al. Novel framework for modelling the cadmium balance and accumulation in farmland soil in Zhejiang Province, East China: Sensitivity analysis, parameter optimisation, and forecast for 2050[J]. Journal of Cleaner Production, 2021, 279. DOI:10.1016/j.jclepro.2020.123674
[17] Hou Y X, Zhao H F, Zhang Z, et al. A novel method for predicting cadmium concentration in rice grain using genetic algorithm and back-propagation neural network based on soil properties[J]. Environmental Science and Pollution Research, 2018, 25(35): 35682-35692. DOI:10.1007/s11356-018-3458-0
[18] 王美娥, 彭驰, 陈卫平. 宁夏干旱地区工业区对农田土壤重金属累积的影响[J]. 环境科学, 2016, 37(9): 3532-3539.
Wang M E, Peng C, Chen W P. Impacts of industrial zone in arid area in Ningxia Province on the accumulation of heavy metals in agricultural soils[J]. Environmental Science, 2016, 37(9): 3532-3539.
[19] Srivastava N, Hinton G, Krizhevsky A, et al. Dropout: a simple way to prevent neural networks from overfitting[J]. The Journal of Machine Learning Research, 2014, 15(1): 1929-1958.
[20] 国家环境保护局, 中国环境检测总站. 中国土壤元素背景值[M]. 北京: 中国环境科学出版社, 1990.
[21] GB 15618-2018, 土壤环境质量农用地土壤污染风险管控标准(试行)[S].
[22] Zhong X, Chen Z W, Li Y Y, et al. Factors influencing heavy metal availability and risk assessment of soils at typical metal mines in Eastern China[J]. Journal of Hazardous Materials, 2020, 400. DOI:10.1016/j.jhazmat.2020.123289
[23] GB 2762-2022, 食品安全国家标准食品中污染物限量[S].
[24] Chen W P, Li L Q, Chang A C, et al. Characterizing the solid-solution partitioning coefficient and plant uptake factor of As, Cd, and Pb in California croplands[J]. Agriculture, Ecosystems & Environment, 2009, 129(1-3): 212-220.
[25] 张红振, 骆永明, 章海波, 等. 水稻、小麦籽粒砷、镉、铅富集系数分布特征及规律[J]. 环境科学, 2010, 31(2): 488-495.
Zhang H Z, Luo Y M, Zhang H B, et al. Characterizing the plant uptake factor of As, Cd and Pb for rice and wheat cereal[J]. Environmental Science, 2010, 31(2): 488-495.
[26] Wang Z W, Nan Z R, Wang S L, et al. Accumulation and distribution of cadmium and lead in wheat (Triticum aestivum L.) grown in contaminated soils from the oasis, north-west China[J]. Journal of the Science of Food and Agriculture, 2011, 91(2): 377-384. DOI:10.1002/jsfa.4196
[27] Liu K, Lv J L, He W X, et al. Major factors influencing cadmium uptake from the soil into wheat plants[J]. Ecotoxicology and Environmental Safety, 2015, 113: 207-213. DOI:10.1016/j.ecoenv.2014.12.005
[28] Yang H R, Huang K, Zhang K, et al. Predicting heavy metal adsorption on soil with machine learning and mapping global distribution of soil adsorption capacities[J]. Environmental Science & Technology, 2021, 55(20): 14316-14328.
[29] Hu W Y, Wang H F, Dong L R, et al. Source identification of heavy metals in peri-urban agricultural soils of southeast China: an integrated approach[J]. Environmental Pollution, 2018, 237: 650-661.
[30] Wiggenhauser M, Bigalke M, Imseng M, et al. Using isotopes to trace freshly applied cadmium through mineral phosphorus fertilization in soil-fertilizer-plant systems[J]. Science of the Total Environment, 2019, 648: 779-786.
[31] Chen W P, Chang A C, Wu L S. Assessing long-term environmental risks of trace elements in phosphate fertilizers[J]. Ecotoxicology and Environmental Safety, 2007, 67(1): 48-58.
[32] Grant C, Flaten D, Tenuta M, et al. The effect of rate and Cd concentration of repeated phosphate fertilizer applications on seed Cd concentration varies with crop type and environment[J]. Plant and Soil, 2013, 372(1-2): 221-233. DOI:10.1007/s11104-013-1691-3
[33] Yazici M A, Asif M, Tutus Y, et al. Reduced root mycorrhizal colonization as affected by phosphorus fertilization is responsible for high cadmium accumulation in wheat[J]. Plant and Soil, 2021, 468(1-2): 19-35. DOI:10.1007/s11104-021-05041-5
[34] Takagi D, Miyagi A, Tazoe Y, et al. Phosphorus toxicity disrupts Rubisco activation and reactive oxygen species defence systems by phytic acid accumulation in leaves[J]. Plant, Cell & Environment, 2020, 43(9): 2033-2053.
[35] Hall J L, Williams L E. Transition metal transporters in plants[J]. Journal of Experimental Botany, 2003, 54(393): 2601-2613.
[36] Chaney R L. How does contamination of rice soils with Cd and Zn cause high incidence of human Cd disease in subsistence rice farmers[J]. Current Pollution Reports, 2015, 1(1): 13-22.
[37] Yang Y, Li Y L, Chen W P, et al. Dynamic interactions between soil cadmium and zinc affect cadmium phytoavailability to rice and wheat: Regional investigation and risk modeling[J]. Environmental Pollution, 2020, 267. DOI:10.1016/j.envpol.2020.115613
[38] Sarwar N, Ishaq W, Farid G, et al. Zinc-cadmium interactions: Impact on wheat physiology and mineral acquisition[J]. Ecotoxicology and Environmental Safety, 2015, 122: 528-536.
[39] Kikuchi T, Okazaki M, Motobayashi T. Suppressive effect of magnesium oxide materials on cadmium accumulation in winter wheat grain cultivated in a cadmium-contaminated paddy field under annual rice-wheat rotational cultivation[J]. Journal of Hazardous Materials, 2009, 168(1): 89-93.
[40] Yang Y, Wang M E, Chen W P, et al. Cadmium accumulation risk in vegetables and rice in southern China: insights from solid-solution partitioning and plant uptake factor[J]. Journal of Agricultural and Food Chemistry, 2017, 65(27): 5463-5469.
[41] 张雪霞, 张晓霞, 郑煜基, 等. 水分管理对硫铁镉在水稻根区变化规律及其在水稻中积累的影响[J]. 环境科学, 2013, 34(7): 2837-2846.
Zhang X X, Zhang X X, Zheng Y J, et al. Accumulation of S, Fe and Cd in rhizosphere of rice and their uptake in rice with different water managements[J]. Environmental Science, 2013, 34(7): 2837-2846.
[42] 唐明灯, 艾绍英, 王艳红, 等. 土壤持水量对生菜生长和镉浓度的影响[J]. 土壤学报, 2012, 49(6): 1158-1163.
Tang M D, Ai S Y, Wang Y H, et al. Effect of soil moisture on growth of and Cd concentration in lactuca sativa[J]. Acta Pedologica Sinica, 2012, 49(6): 1158-1163.
[43] Abedi T, Mojiri A. Cadmium uptake by wheat (Triticum aestivum L.): an overview[J]. Plants, 2020, 9(4). DOI:10.3390/plants9040500