环境科学  2026, Vol. 47 Issue (6): 3595-3604   PDF    
基于可解释性机器学习的城市道路交通碳排放驱动机制识别
谢郑一, 杨鹏, 王紫骁, 胡喜生, 张兰怡     
福建农林大学交通与土木工程学院,福州 350108
摘要: 在城市化加速发展的背景下,机动车保有量持续增长,导致道路交通碳排放迅速上升,成为制约城市绿色转型的重要因素. 为系统识别道路交通碳排放的关键驱动机制,采用“自下而上”法构建2003~2022年福建省城市群的道路交通碳排放清单,并将机动车细分为13种车型进行核算. 其次,结合相关性分析与Lasso回归进行变量筛选,采用多种机器学习算法构建碳排放预测模型. 最后,通过SHAP值提升模型解释性并量化驱动因素贡献. 结果表明:①交通运输业产值、城市绿地面积和发明专利数量是影响碳排放的主要因素;②在各模型中,XGBoost表现最优,测试集R2为0.992,MAE和RMSE分别为7.393×104 t和8.803×104 t;③SHAP分析揭示了关键因素对碳排放的正负向作用路径. 研究从可解释性视角出发,揭示机动车主导下的城市道路交通碳排放驱动机制,可为低碳交通政策制定提供科学支撑.
关键词: 道路交通碳排放      机动车      机器学习      SHAP值      驱动因素分析     
Identification of Urban Road Traffic Carbon Emission Driving Mechanisms Based on Interpretable Machine Learning
XIE Zheng-yi , YANG Peng , WANG Zi-xiao , HU Xi-sheng , ZHANG Lan-yi     
College of Transportation and Civil Engineering, Fujian Agriculture and Forestry University, Fuzhou 350108, China
Abstract: Under the background of accelerated urbanization, the continuous increase in the number of motor vehicles has led to a rapid rise in road traffic carbon emissions, becoming an important factor restricting the green transformation of cities. In order to systematically identify the key driving factors of road traffic carbon emissions, a "bottom-up" approach was used to construct a road traffic carbon emission inventory for the urban agglomerations in Fujian Province from 2003 to 2022, with motor vehicles being subdivided into 13 types for accounting purposes. Secondly, correlation analysis and Lasso regression were combined for variable selection, and multiple machine learning algorithms were used to build carbon emission prediction models. Finally, SHAP values were employed to enhance model interpretability and quantify the contributions of driving factors. The results show that: ① The output value of the transportation industry, urban green space area, and the number of invention patents were the main factors affecting carbon emissions. ② Among all models, XGBoost performed the best, with the test set R2 of 0.992 and MAE and RMSE of 7.393×104 t and 8.803×104 t, respectively. ③ SHAP analysis revealed the positive and negative impact pathways of key factors on carbon emissions. This study, starting from the perspective of interpretability, reveals the driving mechanisms of urban road traffic carbon emissions dominated by motor vehicles, providing scientific support for the formulation of low-carbon transportation policies.
Key words: road transportation carbon emissions      vehicles      machine learning      SHAP value      analysis of driving factors     

随着城市化进程的不断加快,城市空间结构与功能布局不断演化. 交通运输活动规模持续扩大,导致碳排放问题日益严峻. 机动车作为道路交通碳排放的核心主体,已成为交通系统的主要碳源[1]. 据统计,交通运输业碳排放约占全球碳排放总量的25%,对生态环境与可持续发展构成深远影响[2]. 在我国“双碳”战略持续推进的背景下,由机动车驱动的道路交通碳排放已成为制约区域低碳转型的重要因素,交通减排任务尤为迫切. 尽管近年来各地积极推广绿色交通工具与优化运输结构,但道路交通碳排放的总量控制依然面临较大压力,对生态环境质量和“双碳”目标实现构成现实挑战.

已有研究在交通碳排放测算和驱动机制方面取得了较好进展. 在碳排放核算方法方面,“自上而下”法侧重于宏观能源消费数据的估算[3];而“自下而上”法通过细分车辆类型和交通活动水平等数据,更适用于城市尺度的碳排放精细测算[4]. 在驱动机制研究方面,学者们多使用对数平均迪氏指数法以及可拓展的随机性环境影响评估等模型,探索人口规模、经济、机动车保有量和能源结构等因素的影响路径[56]. 综上,已有研究在解析交通碳排放驱动机制方面具备较好的研究框架,但需要注意的是,交通碳排放问题受到多因素综合影响,应考虑驱动因素作用下的非线性问题. 随着数据驱动方法的发展,机器学习具备强大的非线性和多变量交互优势,逐渐被用于驱动机制解析方面的研究. 例如,支持向量机(support vector machine,SVM)适合处理小样本高维数据[7];KNN算法(K nearest neighbors,KNN)能够识别数据中的非线性特征[8];决策树(decision tree,DT)具有良好的可解释性[9];随机森林(random forest,RF)与极端梯度提升树(extreme gradient boosting,XGBoost)等集成模型在高维数据处理方面展现出显著优势[10]. 本团队前期研究表明,相较于内陆地区,沿海地区由于经济发达、交通活跃和路网密度高等特点,其交通碳排放问题尤为突出[11]. 福建省作为我国首批生态文明试验区,地处东南沿海. 其具有经济活跃,城市化水平高,交通密度高等特点,肩负着探索生态与发展协调共进路径的重要使命,在全国生态文明建设大局中占据着先行先试的关键地位. 近年来,随着人口持续流入和城市扩张,机动车保有量大幅上升,道路交通出行强度持续提升,碳排放问题日益突出. 尤其是在福州、泉州和厦门等城市受到交通拥堵与环境问题叠加,交通碳排放问题已成为制约区域可持续发展的重要因素[1]. 因此,福建省面临生态省建设以及交通绿色转型的挑战. 本团队前期已对福建省城市群道路交通碳排放进行了相关研究,基于空间计量研究和数理统计方法探明交通碳排放的驱动机制,揭示道路交通驱动因素具有空间异质性,但尚未探明基于数据驱动的多维驱动因素作用下的道路交通碳排放机制[1213],研究结论可为其他地区的环境治理提供有益借鉴.

综上,本文对福建省城市群道路交通碳排放问题进行研究. 首先,利用“自下而上”法构建道路交通碳排放清单;其次,结合Spearman相关性分析与最小绝对值收缩和选择算子(least absolute shrinkage and selection operator,Lasso)回归筛选出碳排放关键驱动因素,基于多种机器学习算法构建道路交通碳排放回归模型,并比较各模型性能;此外,为了量化每个因素在单个预测结果中的影响力,揭示因素对预测值的正负向作用关系,研究引入SHAP(shapley additive explanations)方法,量化各个驱动因素的边际贡献,识别城市道路交通碳排放的核心驱动机制,以期为城市交通减排政策提供科学依据与方法支撑.

1 材料与方法 1.1 研究区域概况

福建省位于中国东南沿海,是首批国家生态文明试验区之一,兼具良好的生态基础和活跃的区域经济特征. 近年来,伴随着城市化和工业化的推进,机动车保有量持续增长,交通能源消费随之上升. 截至2024年底,全省公路通车总里程达11.64万km,机动车保有量约1 000万辆,近20 a年均增长率超过5%. 福建省现有9个设区市,常住人口超4 100万. 其中,福州、厦门和泉州作为沿海核心城市,经济总量大,城市化水平高,三市GDP总量综合占全省的65%以上,是交通需求最活跃地区. 相较之下,龙岩、三明和南平等内陆地区以农业与资源型产业为主,交通活动强度相对较低,区域碳排放存在显著差异[113]. 此外,福建地形以山地丘陵为主,道路系统以公路运输为主导,人口聚集与城市扩张带来机动车出行需求激增,使得道路交通碳排放问题日益严峻[2]. 在“双碳”战略背景下,亟需在城市尺度识别碳排放驱动机制,以支持地方低碳交通政策的制定与落地. 综上,福建省具有鲜明的区域特征和现实的政策需求,适合作为城市道路交通碳排放驱动机制研究的典型区域.

1.2 数据来源

(1)机动车运行参数  年均行驶里程参考《道路机动车排放清单编制技术指南(试行)》:车辆碳排放因子及百公里油耗数据来自前期相关研究[341114].

(2)宏观社会经济数据  包含机动车保有量、地区生产总值、城镇化率、常住人口和交通运输业产值等指标,源自福建省及所辖设区市统计年鉴.

(3)城市空间与生态指标  城市绿地面积与城市面积取自《中国城市统计年鉴》;城市桥梁数据源于《城市建设统计年鉴》. 需要说明的是,交通运输业产值的统计口径采用交通运输、仓储和邮政业三类产业的合计值,以提高数据一致性与可比性[15].

1.3 驱动因素选取

为全面识别影响碳排放的关键因素,在广泛文献梳理和数据可得性的基础上,选取20个具有代表性的变量,归类为社会发展因素、经济发展因素和交通基础因素类型. 所选取的变量能够较好地反映区域人口结构、经济活动强度和交通基础条件等方面的影响机制. 因素具体说明见表 1.

表 1 碳排放驱动因素 Table 1 Driving factors of carbon emissions

1.4 研究方法 1.4.1 道路交通碳排放量测算

研究采用“自下而上”法对道路交通碳排放量进行估算. 基于车辆运载类型、燃料种类和使用特征,将机动车划分为13类,包括大型载客汽车(柴油)、中型载客汽车(汽油)、中型载客汽车(柴油)、小型载客汽车(汽油)、小型载客汽车(柴油)、微型载客汽车(汽油)、重型载货汽车(柴油)、中型载货汽车(汽油)、中型载货汽车(柴油)、轻型载货汽车(汽油)、轻型载货汽车(柴油)、微型载货汽车(汽油)与新能源汽车(纯电动)[11]. 碳排放测算模型见式(1):

E=i=1nj=1nVKTiFijNij (1)

式中,E为道路交通中机动车的CO2排放量,t;VKTii类机动车的年均行驶里程,km;Fiji类机动车j类燃料的碳排放因子,kg·km-1Niji类机动车j类燃料的保有量,辆.

1.4.2 数据预处理

为提升模型稳定性与预测精度,采用线性插值法补齐缺失数据. 之后,对利用最小-最大归一化方法对特征进行标准化,以统一量纲并消除尺度效应[27]. 计算如式(2):

x'=x-xminxmax-xmin (2)

式中,x为原始数据中一个特征列中的一个值;xmin为特征列中的最小值;xmax为特征列中的最大值;x′为归一化后的数据.

1.4.3 模型构建与评估方法

研究选取多元线性回归(multiple linear regression,MLR)、SVM、RF、XGBoost、KNN和DT. 各模型的特点如下:

(1)MLR是一种经典的统计学方法,主要用于探究多个预测变量与单一连续结果变量之间的内在关系. 其能够精准且同步地考量多个因素对结果产生的综合效应,但其较难处理非线性关系.

(2)SVM通过将所有变量映射到一个高维特征空间,并在该空间中寻找到一个超平面,以有效分隔不同样本点,从而构建出优秀的预测模型. 该模型在处理高维稀疏数据时性能表现良好,但在大规模数据因其训练复杂度较高,效率较低[28].

(3)RF通过构建大量决策树并将预测结果进行投票或取平均值,从而提高模型的准确性与泛化能力;同时,其可利用随机抽样的方式来选择特征和样本,减少过拟合的风险. 在高维数据的回归问题中表现优异,但模型复杂度高,可能存在过拟合的风险[29].

(4)XGBoost具有精度高、抗多重共线性和稳定性强等优点. 其通过迭代构建一系列弱学习器,并将它们累加起来形成一个强学习器,每一棵新的决策树都拟合前一棵树预测结果的残差,以此逐步减少整体模型的损失函数[30].

(5)KNN在进行预测时,通过计算测试集中的点与训练集中点与点之间的距离,选择最近的K个数据点,并根据这些最近邻点的类别来决定待分类点的类别. 该算法通常采用多数投票的方式来确定最终的类别. 然而,该算法对数据集质量敏感,且计算量大[31].

(6)DT通过构建树状模型来学习数据特征之间的关系并进行预测. 其通过特征选择标准分割数据集,直到满足特定的停止条件. DT具有可解释性强,计算速度快的优点,但是对噪声数据敏感,易过拟合[32].

考虑到各数据的可获取性与准确性,将2003~2022年的数据作为模型训练的数据集,按80%和20%的比例将数据集划分为训练集与测试集. 采用决定系数(R2)、均方根误差(root mean squared error,RMSE)和平均绝对误差(mean absolute error,MAE)评估各个模型的拟合性能. 其中,R2越高代表模型拟合效果越好,RMSE与MAE越小代表拟合误差越小.

1.4.4 驱动因素筛选

采用Spearman相关性分析方法分析变量与碳排放量之间的关系. 该方法优势在于对数据分布要求低、适合顺序数据、对异常值不敏感、能揭示非线性相关性. Spearman系数阈值设置为r0.4,以筛除弱相关变量[33],如式(3)所示:

r=1-6i=1ndi2n(n2-1) (3)

式中,r为相关系数,di为两个变量的秩次之差,n为数据对数量. 系数取值范围为-1~1. 当系数为1时,表示两个变量之间完全正相关;当系数为-1时,表示两个变量之间完全负相关关系;当系数为0时,表示两个变量之间没有明显的相关性.

进一步地,利用Lasso回归对变量进行特征筛选. 其通过引入正则化参数,以均方误差为指标,将不重要的变量系数压缩为0,通过抑制多重共线性来提高模型准确性[34],如式(4)所示:

β^=min12ni=1nyi-β0-j=1p βjxij2+λj=1p βj (4)

式中,β^为最优截距系数;yi为第i个观测值的因变量,即碳排放量;xij为第i个观测值的第j个特征变量;β0为截距项;βj为第j个特征变量的系数;n为观测值的数量;p为特征变量的数量;λ为正则化参数.

1.4.5 可解释性分析

为揭示机器学习模型中驱动因素对碳排放的贡献,引入SHAP方法进行加性解释,揭示输入变量对预测值的作用关系,弥补机器学习模型解释性不足的缺点[35]. 其计算如式(5)所示:

SHAP(f,x,S)=i=1nT!(n-T)!n!f(x)-f(xS/T) (5)

式中,f为模型的预测函数;x为驱动因素;n为所有因素集合;T为集合T中的因素数量;ST中的因素子集;xS/T为除T之外所有因素的观测值.

2 结果与分析 2.1 福建省道路交通碳排放时空变化特征 2.1.1 道路交通碳排放时间变化特征

2003~2022年,福建省道路交通碳排放整体呈显著上升趋势,由2003年的335.125万t上升至2022年的2 068.167万t,年均增长率约为10.36%,累计排放量达23 057.32万t(见图 1). 其中,由于经济快速发展与交通基础设施的扩张,2003~2012年为碳排放的快速增长期,年均增速达15%;尤其在2008~2009年,增速突破39%. 而在2012年后,碳排放增速逐渐放缓,年均增长率降至6.15%,这主要与福建省经济发展进入平稳阶段及各类交通减排政策实施有关,例如《“十二五”高速公路规划》《“十四五”现代综合交通体系专项规划》等文件在交通结构调整和节能减排方面起到积极作用. 至2022年,全省碳排放量首次出现同比下降(-0.73%),这可能与新能源汽车推广、政策调控持续发力以及疫情影响下出行量减少有关.

图 1 福建省道路交通碳排放总量及趋势 Fig. 1 Total amount and trend of carbon emissions from road transportation in Fujian Province

2.1.2 道路交通碳排放空间变化特征

福建省道路交通碳排放在空间上呈现为“沿海高、内陆低”的格局(图 2),且区域差异日益扩大. 其中,福州、厦门和泉州作为东部沿海代表城市,交通碳排放量增长最为显著,2003~2022年间年均增速达15%. 至2022年,三市的交通碳排放量分别达到386.592万、403.359万和400.852万t,合计占全省总排放量的57.5%. 高排放区的成因主要如下,首先,三市地处福建平原地带,具备良好交通可达性;其次,经济发展水平较高,2022年三市GDP合计占全省的60.65%,支撑了高度活跃的交通运输需求,共同推动机动车保有量持续增加,形成高强度的道路交通碳排放源区. 相较而言,宁德、莆田和漳州虽同属沿海城市,但因城市规模小、人口密度相对较低,道路交通活动强度有限,2022年三市合计仅占全省交通碳排放的约20%. 在内陆城市中,龙岩、南平和三明三市2022年合计碳排放占全省约22.5%. 该区域以山地丘陵为主,交通基础设施相对薄弱,城市空间分散,人口流出趋势明显,经济以资源型和农业型产业为主,交通刚性需求较低,导致碳排放总量和强度均显著低于沿海城市.

图 2 2003~2022年福建省城市道路交通碳排放时空分布结果 Fig. 2 Results of spatial and temporal distribution of urban road traffic carbon emissions in Fujian Province from 2003 to 2022

2.2 交通碳排放驱动因素筛选 2.2.1 驱动因素相关性分析

对初选的20个驱动因素与碳排放(carbon emissions,CE)进行相关性分析(图 3). 根据相关性阈值判断,初步剔除6个与CE相关性较弱的因素(STO、SSI、STI、PV、URL和RP),保留14个待选因素. 为了探明因素之间是否具有多重共线性问题,采用Lasso回归进行检验.

图 3 驱动因素与碳排放相关关系 Fig. 3 Correlation relationship between drivers and carbon emissions

2.2.2 Lasso回归驱动因素筛选

图 4(a)为利用Lasso回归确定最佳惩罚参数的过程;图 4(b)为Lasso回归的系数路径图. 当λ=1.451时,模型均方误差最小,对应剔除掉PRP、TRSCG、PD、GDPGR和NPTV这5个因素. 其中,PRP被Lasso模型所筛除. 然而,已有研究证明人口对道路交通碳排放有较大影响[101618~22],且与其他因素如PD与IL等之间存在重要的潜在关系,可能会对道路交通碳排放有重要的间接影响. 因此,选择保留PRP这一因素. 综上,筛选出如下10个关键驱动因素进行预测模型构建:TO、FV、UGSA、GDP、GDPPC、UR、BN、IL、IP和PRP.

部分λ值对应相同的特征筛选结果,导致非零特征数出现重复 图 4 Lasso回归模型的交叉验证曲线与系数路径分析 Fig. 4 Cross-validation curves and coefficient path diagram of Lasso regression model

2.3 模型构建与评估

基于筛选出的10个驱动因素,分别构建MLR、SVM、RF、XGBoost、KNN和DT这6个福建省道路交通碳排放回归模型. 采用网格化搜索与十折交叉验证,对每个模型设置参数搜索范围,并分别训练寻找最优配置. 如图 5所示,6种模型在训练集上均表现出良好拟合性能,R2均大于0.950. 其中,XGBoost模型的R2值达到了0.999;MAE和RMSE分别为1.537万t和1.960万t,说明XGBoost模型误差最小,拟合精度最高. 然而,该模型在训练集上的极高精度也提示该模型可能存在过拟合的风险.

图 5 模型在训练集上的预测结果 Fig. 5 Model's prediction results on the training set

进一步分析测试集,图 6展示了各模型的拟合表现. 就R2指标而言,XGBoost模型在测试集上依然取得最高值(0.992),显著高于其他模型,说明其对数据的解释能力最强;在误差指标方面,XGBoost的MAE和RMSE分别为7.394万t和8.803万t,为6个模型中最低. 相比之下,其他模型如MLR、DT和SVM等误差明显偏高;而XGBoost在测试集上同样保持出色的预测性能,且训练误差与测试误差差距合理,说明该模型未出现过拟合现象,验证了其在不同数据集(训练集和测试集)上均具有稳定的预测能力. 对XGBoost模型进一步调优,通过网格化搜索及交叉验证,对树的最大深度、学习率、特征采样比例及树的数量进行了组合测试. 最终确定最优参数为:树深为3,学习率为0.1,特征采样比例为80%,树的数量为200棵,单个叶节点的最小样本权重为1.

图 6 模型在测试集上的预测结果 Fig. 6 Model's prediction results on the test set

2.4 关键驱动因素识别

为揭示XGBoost模型中各变量对预测结果的具体影响,引入SHAP方法对模型进行解释性分析(图 7). 结果显示,在10个关键驱动因素中,对碳排放的贡献程度依次为:TO(29.427)、UGSA(26.692)、IP(11.164)、GDP(8.133)、BN(8.007)、FV(7.231)、GDPPC(7.186)、UR(7.117)、PRP(5.683)以及IL(1.046). 其中,TO对预测结果的影响最大,SHAP值分布较广,蓝色样本点集中,红色样本点分散,表现出稳定的正向作用,表明该因素直接反映交通活动强度与经济规模对碳排放的推动力. 对道路交通碳排放影响次之的是UGSA,与碳排放呈正相关关系. 在城市扩张过程中,城市绿地面积的增加虽然在一定程度上有助于缓解碳排放,但在城市化进程中,绿地建设往往伴随着更多的道路交通基础设施建设和车辆流量,从而间接推高了碳排放. IP的SHAP值较高但分布集中,表明技术创新的作用机制复杂,既可能通过节能技术降低排放,也可能带来新的交通能源需求增加排放. GDP与GDPPC分别代表宏观与人均经济水平,二者对碳排放的影响不完全一致:一方面,GDP作为宏观经济总量指标,与交通能源消费强度高度相关. 经济总量的增长往往伴随着更高的生产总值、货物流动量与机动车出行需求,导致碳排放总量上升,其SHAP值呈现广泛的正向分布,反映出GDP在不同发展阶段下对碳排放具有较为一致的促进效应;另一方面,GDPPC作为衡量居民生活水平的指标,其对碳排放的影响呈现更为复杂的阶段性特征. 在经济发展的早期阶段,随着收入增长,交通消费结构逐渐升级,居民购车与出行频率显著增加,碳排放显著上升;但当人均GDP达到一定水平后,社会环保意识增强、公共交通系统完善以及新能源汽车普及,使得碳排放强度下降. BN与FV的SHAP值相近,均对碳排放有正向推动作用. 桥梁数量的增加体现了道路交通基础设施的完善,而公路货运量的提升则反映了经济活动的活跃. 两者促进了经济发展和人员流动,导致交通流量和燃料消耗的增加,使得碳排放量上升. UR的SHAP值分布在两侧,反映出城市道路交通功能密度、交通结构与空间布局对碳排放的复杂影响,其增加既能提升交通效率,也可能因过度建设导致城市蔓延和流量增加,进而加剧碳排放. 在SHAP分析框架下,PRP与IL分别代表出行需求端与承载能力端的关键因素,两者对碳排放的影响机制呈现出复杂的分布特征. 人口与人口集聚带来的出行压力在当前模型中仍是碳排放的主要增长因素,但在部分交通基础设施较完善的区域,其负效应可被部分缓冲.

图 7 基于XGBoost模型的SHAP值分析结果 Fig. 7 Analysis results of SHAP values based on XGBoost model

3 讨论

福建省道路交通碳排放在2003~2012年间经历了快速增长期,受经济高速发展与交通基础设施大规模扩张双重驱动,碳排放显著上升. 其中,在2013~2021年,随着产业结构优化和节能减排政策持续实施,碳排放增速逐步放缓. 在2022年排放量首次出现下降,可能与新能源汽车推广、疫情影响出行需求以及相关调控政策共同作用有关. 从空间格局看,福州、厦门和泉州等沿海发达城市是主要排放源区,体现出区域经济水平与碳排放之间的显著关联. 机动车是城市道路交通碳排放的主要来源,聚焦该部分可有效识别核心驱动因素,但未涵盖道路建设机动车生产等间接碳源,未来研究可进一步拓展碳源边界.

现有模型只考虑了宏观面板数据,缺乏对城市交通行为微观机制的直接刻画. 未来可引入如手机信令、气候数据等更多维度数据,提高变量分辨率与模型拟合精度. 在分析维度上,可针对不同类型城市或不同城市群开展分组建模,探索具有代表性的低碳交通发展路径. 在建模方面,未来可结合深度学习方法进一步挖掘数据的潜在关联,减少对复杂参数调优的依赖,提升预测效果与泛化能力.

交通运输业产值、GDP、城市绿地面积和发明专利数量等变量对碳排放具有显著影响. 其中,GDP与交通运输业产值呈正相关,表明经济与交通规模扩大仍是碳排放增长的主因;城市绿地面积的正向SHAP值表明,在城市扩张过程中,绿地建设与道路交通基础设施建设及车辆流量增长的关联更为显著,从而间接推高了碳排放. 因此,在城市规划中,应重视绿化布局与交通规划的融合,优化绿地的碳汇功能;发明专利数量对碳排放的影响路径具有复杂性. 一方面,绿色技术创新可降低单位交通碳排放(如新能源汽车和智能交通系统等);另一方面,许多技术的应用可能伴随新的出行或能耗需求,或者是因为技术进步带来的新产业或服务模式,如物流配送的便利化可能会导致更多的货物运输需求,进而增加交通碳排放. 因此,在推动技术进步的同时,需要强化其环境目标引导,确保技术发展与减排目标协同共进.

4 结论

(1)福建省道路交通碳排放清单显示2003~2022年福建省道路交通碳排放总量呈显著增长趋势,由2003年的335.125万t上升至2022年的2 068.167万t,年均增长率约为10.36%. 碳排放增长过程存在明显的阶段性特征,2012年前增长迅速,随后增速趋缓. 碳排放空间上表现为“沿海高、内陆低”,福州、泉州和厦门三座沿海城市的碳排放量占全省总排放量的57.5%;而南平、龙岩和三明等内陆城市在2012年后增长幅度明显加快,反映出区域道路交通碳排放趋势具有差异性.

(2)结合相关性分析,采用Lasso回归筛选出10个关键驱动因素,并构建多元线性回归、支持向量机回归、随机森林、极端梯度提升树、K近邻算法和决策树等6种道路交通碳排放预测回归模型. 结果表明,在所有模型中,XGBoost在训练集和测试集上性能最优,测试集R2达到0.992,MAE值为7.393万t,RMSE值为8.803万t,表现出更高的拟合精度与泛化能力.

(3)对筛选的驱动因素进行SHAP分析,揭示各因素对道路交通碳排放的边际贡献. 对道路交通碳排放贡献率较大的分别是交通运输业产值、绿地面积、发明专利数量、地区生产总值、桥梁数量和道路交通货运量等,其对道路交通碳排放回归模型的贡献值分别为29.427、26.692、11.164、8.133、8.007和7.231.

参考文献
[1] Zhang L Y, Weng D W, Wen X J, et al. Unveiling intra-provincial cities carbon gap: exploring transportation emissions in ecological Vanguard[J]. Transportation Research Part D: Transport and Environment, 2025, 144. DOI:10.1016/j.trd.2025.104799
[2] Zhang L Y, Weng D W, Xu Y N, et al. Spatio-temporal evolution characteristics of carbon emissions from road transportation in the mainland of China from 2006 to 2021[J]. Science of the Total Environment, 2024, 917. DOI:10.1016/j.scitotenv.2024.170430
[3] 张兰怡, 徐艺诺, 翁大维, 等. 经济高质量发展背景下中国省域物流业碳排放时空分异[J]. 环境科学, 2024, 45(9): 5086-5096.
Zhang L Y, Xu Y N, Weng D W, et al. Spatiotemporal differentiation of carbon emissions from logistics industry at provincial scale in China under the background of high-quality economic development[J]. Environmental Science, 2024, 45(9): 5086-5096. DOI:10.13227/j.hjkx.202311015
[4] Weng D W, Zhang H F, Wen X J, et al. Co-benefits of carbon and pollutant emission reduction in urban transport: sustainable pathways and economic efficiency[J]. Urban Climate, 2025, 60. DOI:10.1016/j.uclim.2025.102348
[5] 何磊, 李诗芸, 袁卓琳. 基于STIRPAT模型的浙江省交通碳排放影响因素研究[J]. 交通节能与环保, 2024, 20(5): 42-45.
He L, Li S Y, Yuan Z L. Research on the impact factors of transport carbon emission in Zhejiang Province based on STIRPAT model[J]. Transport Energy Conservation & Environmental Protection, 2024, 20(5): 42-45.
[6] 戢晓峰, 王娟, 陈方, 等. 云南省城市营运柴油货车碳排放测度及空间分异特征[J]. 公路交通科技, 2023, 40(2): 190-197.
Ji X F, Wang J, Chen F, et al. Carbon emission measurement and spatial differentiation characteristics of urban operating diesel trucks in Yunnan Province[J]. Journal of Highway and Transportation Research and Development, 2023, 40(2): 190-197.
[7] 高金贺, 黄伟玲, 蒋浩鹏. 城市交通碳排放预测的多模型对比分析[J]. 重庆交通大学学报(自然科学版), 2020, 39(7): 33-39.
Gao J H, Huang W L, Jiang H P. Comparison of multiple forecast models of urban traffic carbon emissions[J]. Journal of Chongqing Jiaotong University (Natural Science), 2020, 39(7): 33-39.
[8] 李国堂, 宋福浩, 陈杰, 等. 考虑碳排放的综合能源系统"结构-型号-容量"优化模型[J]. 电力建设, 2022, 43(7): 37-47.
Li G T, Song F H, Chen J, et al. Structure-model-capacity optimization model of integrated energy system considering carbon emissions[J]. Electric Power Construction, 2022, 43(7): 37-47.
[9] 刘慧甜, 胡大伟. 基于机器学习的交通碳排放预测模型构建与分析[J]. 环境科学, 2024, 45(6): 3421-3432.
Liu H T, Hu D W. Construction and analysis of machine learning based transportation carbon emission prediction model[J]. Environmental Science, 2024, 45(6): 3421-3432. DOI:10.13227/j.hjkx.202305234
[10] 宋永朝, 舒秦, 金程容, 等. 中国区域交通碳排放预测与碳达峰路径规划[J]. 环境科学, 2025, 46(4): 1995-2008.
Song Y C, Shu Q, Jin C R, et al. Regional transport carbon emission forecasting and peak carbon pathway planning in China[J]. Environmental Science, 2025, 46(4): 1995-2008. DOI:10.13227/j.hjkx.202403152
[11] 张兰怡, 徐艺诺, 王硕, 等. 碳达峰背景下沿海城市群道路交通节能减排潜力[J]. 交通运输系统工程与信息, 2024, 24(5): 45-55.
Zhang L Y, Xu Y N, Wang S, et al. Energy saving and emission reduction potential of road traffic in coastal urban agglomerations under background of carbon peak[J]. Journal of Transportation Systems Engineering and Information Technology, 2024, 24(5): 45-55.
[12] 戈秋虞, 张兰怡, 邱荣祖, 等. 基于GDIM法的福建省交通碳排放驱动因素分析[J]. 福建农林大学学报(自然科学版), 2022, 51(1): 131-136.
Ge Q Y, Zhang L Y, Qiu R Z, et al. Analysis on driving factors of transportation carbon emissions in Fujian Province based on GDIM[J]. Journal of Fujian Agriculture and Forestry University (Natural Science Edition), 2022, 51(1): 131-136.
[13] 翁大维, 谢郑一, 温晓娟, 等. 福建省城市群道路交通碳排放时空异质性[J]. 环境科学, 2025, 46(8): 4826-4838.
Weng D W, Xie Z Y, Wen X J, et al. Spatial and temporal heterogeneity of road transportation carbon emissions in urban agglomerations of Fujian Province[J]. Environmental Science, 2025, 46(8): 4826-4838. DOI:10.13227/j.hjkx.202408058
[14] 徐艺诺, 翁大维, 王硕, 等. 粤闽浙沿海重点城市道路交通节能减排路径[J]. 环境科学, 2024, 45(5): 3107-3118.
Xu Y N, Weng D W, Wang S, et al. Energy-saving and emission reduction path for road traffic in key coastal cities of Guangdong, Fujian and Zhejiang[J]. Environmental Science, 2024, 45(5): 3107-3118. DOI:10.13227/j.hjkx.202305249
[15] 张立国, 李东. 中国物流业能源消耗、碳排放与行业发展关系分析[J]. 科技管理研究, 2015, 35(24): 238-243.
Zhang L G, Li D. An analysis of relationship among energy consumption, carbon emission and economic growth on China's logistics[J]. Science and Technology Management Research, 2015, 35(24): 238-243.
[16] 李渊, 张芝镪, 温慧, 等. 基于机器学习的中国碳排放影响因素分析与达峰情景模拟[J]. 环境科学, 2025, 46(10): 6097-6109.
Li Y, Zhang Z Q, Wen H, et al. Analysis of the influencing factors of China's carbon emissions and simulation of peak scenarios based on machine learning[J]. Environmental Science, 2025, 46(10): 6097-6109. DOI:10.13227/j.hjkx.202409041
[17] 杨文越, 梁斐雯, 曹小曙. 多尺度建成环境对居民通勤出行碳排放的影响——来自广州的实证研究[J]. 地理研究, 2020, 39(7): 1625-1639.
Yang W Y, Liang F W, Cao X S. Examining the effects of the multi-scale built environment on residents' CO2 emissions from commuting: an empirical study of Guangzhou[J]. Geographical Research, 2020, 39(7): 1625-1639.
[18] 周岸, 吴开亚. 上海市交通碳排放驱动因素分析[J]. 合肥工业大学学报(自然科学版), 2020, 43(2): 264-269.
Zhou A, Wu K Y. Driving factors analysis of traffic carbon emissions in Shanghai[J]. Journal of Hefei University of Technology (Natural Science), 2020, 43(2): 264-269.
[19] Cao P J, Liu Z, Zhang H, et al. The impact of agglomeration on CO2 emissions in China's transport sector: a spatial econometric analysis[J]. Sustainable Cities and Society, 2024, 117. DOI:10.1016/j.scs.2024.105966
[20] Xu B, Lin B Q. Investigating the differences in CO2 emissions in the transport sector across Chinese provinces: evidence from a quantile regression model[J]. Journal of Cleaner Production, 2018, 175: 109-122. DOI:10.1016/j.jclepro.2017.12.022
[21] 胡茂峰, 郑义彬, 李宇涵. 多情景下湖北省交通运输碳排放峰值预测研究[J]. 环境科学学报, 2022, 42(4): 464-472.
Hu M F, Zheng Y B, Li Y H. Forecasting of transport carbon emission peak in Hubei Province under multiple scenarios[J]. Acta Scientiae Circumstantiae, 2022, 42(4): 464-472.
[22] 李竹, 王兆峰, 吴卫, 等. 碳中和目标下中国省域碳平衡能力与城镇化的关系[J]. 自然资源学报, 2022, 37(12): 3136-3152.
Li Z, Wang Z F, Wu W, et al. The relationship between China's provincial carbon balance capacity and urbanization under carbon neutrality target[J]. Journal of Natural Resources, 2022, 37(12): 3136-3152.
[23] 尹碧波, 邝萍. 智慧城市的碳减排效应研究: 基于双重机器学习的因果推断[J]. 统计与信息论坛, 2025, 40(3): 73-86.
Yin B B, Kuang P. The carbon emission reduction effect of smart cities: causal inference based on double machine learning[J]. Journal of Statistics and Information, 2025, 40(3): 73-86.
[24] Cao P J, Liu Z. The impact of population characteristics on transportation CO2 emissions—does population aging important?[J]. Environmental Science and Pollution Research, 2024, 31(7): 10148-10167.
[25] Wu X Y, Tao T, Cao J, et al. Examining threshold effects of built environment elements on travel-related carbon-dioxide emissions[J]. Transportation Research Part D: Transport and Environment, 2019, 75: 1-12.
[26] 王丽萍, 刘明浩. 基于投入产出法的中国物流业碳排放测算及影响因素研究[J]. 资源科学, 2018, 40(1): 195-206.
Wang L P, Liu M H. Carbon emission measurement for China's logistics industry and its influence factors based on input-output method[J]. Resources Science, 2018, 40(1): 195-206.
[27] 杨寒雨, 赵晓永, 王磊. 数据归一化方法综述[J]. 计算机工程与应用, 2023, 59(3): 13-22.
Yang H Y, Zhao X Y, Wang L. Review of data normalization methods[J]. Computer Engineering and Applications, 2023, 59(3): 13-22.
[28] 苏筱倩, 安俊琳, 张玉欣. 基于支持向量机回归和小波变换的O3预报方法[J]. 中国环境科学, 2019, 39(9): 3719-3726.
Su X Q, An J L, Zhang Y X. Support vector machine regression forecasting of O3 concentrations based on wavelet transformation[J]. China Environmental Science, 2019, 39(9): 3719-3726.
[29] 宋龙娟, 胡睿琪, 刘兵, 等. 基于随机森林的川东北城市群臭氧污染预报研究[J]. 中国测试, 2024, 50(11): 150-159.
Song L J, Hu R Q, Liu B, et al. Ozone pollution forecasting in northeast Sichuan City Cluster based on random forest[J]. China Measurement & Test, 2024, 50(11): 150-159.
[30] 彭岩, 马铃, 张文静, 等. 基于集成学习的风险预测模型研究与应用[J]. 计算机工程与设计, 2022, 43(4): 956-961.
Peng Y, Ma L, Zhang W J, et al. Research and application of risk forecast model based on ensemble learning[J]. Computer Engineering and Design, 2022, 43(4): 956-961.
[31] 罗向龙, 李丹阳, 杨彧, 等. 基于KNN-LSTM的短时交通流预测[J]. 北京工业大学学报, 2018, 44(12): 1521-1527.
Luo X L, Li D Y, Yang Y, et al. Short-term traffic flow prediction based on KNN-LSTM[J]. Journal of Beijing University of Technology, 2018, 44(12): 1521-1527.
[32] 赵国锋, 高玉龙, 王仲. 基于决策树与蒙特卡洛仿真的交通碳排放分析方法[J]. 公路, 2015, 60(8): 191-195.
[33] 卞利花, 吉敏全. 青海交通碳排放影响因素及预测研究[J]. 生态经济, 2019, 35(2): 35-39, 100.
Bian L H, Ji M Q. Research on influencing factors and prediction of transportation carbon emissions in Qinghai[J]. Ecological Economy, 2019, 35(2): 35-39, 100.
[34] 崔鸿雁, 徐帅, 张利锋, 等. 机器学习中的特征选择方法研究及展望[J]. 北京邮电大学学报, 2018, 41(1): 1-12.
Cui H Y, Xu S, Zhang L F, et al. The key techniques and future vision of feature selection in machine learning[J]. Journal of Beijing University of Posts and Telecommunications, 2018, 41(1): 1-12.
[35] 王志强, 任金哥, 韩硕, 等. 基于可解释性机器学习的建筑物物化阶段碳排放量预测研究[J]. 安全与环境学报, 2024, 24(6): 2454-2466.
Wang Z Q, Ren J G, Han S, et al. Interpretable machine learning-based carbon emission prediction in the materialization stage of buildings[J]. Journal of Safety and Environment, 2024, 24(6): 2454-2466.