2023年12月31日发(作者:精华学校高三数学试卷)

理讼研付新冠肺炎疫情对我国季度GDP增速影响估测——基于机器学习回归预测模型李颖谭广摘要:为了定量估测新冠疫情对我国宏观经济基础性指标GDP的影响,首先构建GDP增速预测指标体系,再运用

13种机器学习回归模型对1997-2019年历史數据进行建模测算,根据模型评估指标优选出泛化能力最佳的梯度提升

回归树(GBKT)模型,预测非疫情影响下的2020年前三季度GDP增速结果表明,疫情暴发导致这三季度GDP增长率分

别损失 13.5 丨 %, 3.23%,1.56%关键词:新冠疫情;GDP增速;机器学习;梯度提升回归树—\'弓j言2020年以来,受新冠肺炎疫情持续蔓延影响,我国肖年前

三季度GDP同比增速分别为-6.8%,3.2%,4.8%,出现了自

1992年季度GDP核算以来的首次负值。此次新冠疫情致病性

强、传播范围广、持续时间长、影响层次深、不确定性大。我国

二、机器学习回归预测模型理论(一) 机器学习回归预测模型本文采用的经典机器学习方法有hanging回归、Adahoost

回归、XGhoosl回归、随机森林回归(RF)、梯度提升回归树

(GBKT)、弹性网络回归(ElastirNet)、贝叶斯岭回归

(BayesianRidgp)、决策树回归(DpcisionTree >、支持向量机回归

GDPif速不仅面临国内经济结构转型压力,还受到中美贸易

摩擦博弈明显的影响,在国内外双重压力共振下,新冠疫情的

持续存在,让我国经济环境盘根错节,:历年以来,SARS、H1N1、埃博拉疫情等突发性公共卫生

事件对经济的影响持续受到学界广泛关注。新冠肺炎疫情发

生后,陈林等基于文献回顾视角,梳理重大传染病疫情大规

模传播原因周新辉等选用贝叶斯岭回归模型估测在三种

情景下,中国中小服务型企业所受疫情冲击的数值。周梅

芳、张文斗、吴婷婷等从供给侧、需求侧、区域经济与行业经

济、产业链及供应链等方面探讨新冠疫情对我国经济造成

的负面冲击通过梳理相关文献发现,现有研究多侧重于从微观角度

分析疫情对某一经济产业或行为主体的影响,未能量化评

估新冠疫情对我国宏观经济的影响。而GDP作为宏观经济

的基础性指标,探究疫情对GDP增速的影响,可为我国找

寻疫情损失提供理论依据:基于机器学习算法无需对数据

作出假定要求,以及结果可用交叉验证判断的特点,本文

利用开源的Python语言,通过机器学习不同回归算法模型对

历史数据进行建模测算,再选取最优预测模型估测未发生新

冠疫情情况下,2020年第一季度至第-季度的GDP抬速,定量

分析在现有防控体系下新冠肺炎疫情对我国GDP增速的影

响。(SVR )、K最近邻回归(KNNRegrPSS〇r),其中前7种属于集成学

习,是将多个弱学习器组合成的强学习器同时还辅以传统预

测方法:线性回归<

LR )

Jasso回归、岭回归(Ridgf).将这13种方

法的预测结果进行比较,优选出梯度提升回归树(GBRT)算法

模型进行2020年第一季度至第三季度的GI)P增速预测。(二) 梯度提升回归树(GBRT)算法理论若输入训练集为:T=((x, ,y,), (x2,y2),…,(x、,y、)}.训练

样本i=l,2,-,N,迭代轮数t=l,2,…,T,损失函数为L,则梯度

提升回归树(GBRT)回归算法主要分为以下三步:首先,初始化弱学习器:f„(

x

>=argmin

X

L(

y,,

r)i=l其次,计算负梯度rH及回归树每个叶子节点区域M勺输

出值、,并更新强学习器:

aL(y_,f(Xi))r“= 一

L 元

EK.\'Jf

L(yi,(-i(xi),(、)Mf|(x)=f1_,(x)+XrlmI(xERim)最后,得到强学习器:f(

x

H.(

x )=((x)+

j;

J

r,mI(

x

E

R

J1=1

tn=l中国农业会计2021

—3

ES

理讼岈付三、季度GDP增速预测指标体系构建度增速。(二)數据来源及处理方式(一)变量选取指标的获取来源主要为国家统计局官网(hitp:

//)和中经网统计数据库(https: //)月

度数据选取时间为1997年1月至2020年9月,季度数据的选取时

间为1997年第一季度至2020年第二季度,缺失值用Python中的

GDP季度增速的预测指标体系已有多篇文献进行讨论,

结合我国经济发展的阶段性特征,并参考肖争艳做法,综合选

取反映消费水平、国内外贸易水平、重点产业、投资及能源、金

融及财政等方面的指标,构成14个变量(见表丨)以预测GI)P季表1指标GDPIVATHIRDICPIRPIPPIRECIELECM2SCGEXPORTIMPORTTLONA

imerpnlatef )进行插值处理:指标解释及处理方式如表1所示。指标解释及处理方式数据频率季度季度季度月度月度月度月度月度月度月度月度月度月度月度月度处理方式指标名称国内生产总值同比增速工业增加值指数第孑产业增加值指数居民消费价格指数(同比)商品零售价格指数(同比)I:业生产者出厂价格指数(同比)--—月度数据减去100,每3个月取均值月度数据减去100,每3个月取均值月度数据减去100,每3个月取均值每3个月度数据取均值每3个月度数据取均值每3个月度数据取均值每3个月度数据取均值每3个月度数据取均值每3个月度数据取均值每3个月度数据取均值每3个月度数据取均值每3个月度数据取均值国房景气指数(当期)发电量同比增速货币和准货币期末同比增速社会消费品零售总额同比增速出口额(美元)当期同比增速进口额(美元)当期同比增速金融机构人民币各项贷款余额期末同比增速固定资产投资同比增速•般公共预算支出同比增速(当期)IG表2 13种回归模型的评估指标结果比较回归模型GradientBoostXGBoostBayesianRidgcElasticNetBaggingRandomForestAdaBoostRidgeLinearRegressionKNNRegressorSVRI^assoDecisionTrceR2EvarMAEMSE0. 89330.88370.84240.73730. 72660.70720. 69570. 64090.64560. 62830. 6790. 5660. 53280.80130. 79910. 78170. 70480. 69770.6780. 63610. 61530. 6070.60110. 55250. 53040. 47550. 29350.28460. 31890. 31700. 31620. 37130. 44050. 46630. 52410.68600. 64310.81380. 89720. 12490. 12520.16850. 16870. 16890.29600. 33390. 38900. 63380.96311. 10481. 38281. 4027EB 中国农业会计2021—3

理讼叫付弱。四、预测模型比较及选择(一)模型效果检验(二)预测结果比较接下来进一步利用上述前五种效果较佳的回归模型对

被解释变量(;DP增速进行预测,得到2018Q1-2019Q4预测结

果见图1。从图1可以明显看出,梯度提升回归树(GBKT )

模型的预测值与实际值的拟合度最高,预测效果最好。

收集并处理好相关数据后,利用PythonI具以及机器学

习库(Skeam)对数据进行建模分析。具体地,划分样本数据的

60%作为训练集,20%作为验证集,20%作为测试集,再把训练

集导人到不同的回归模型中进行建模训练,然后用验证集对

模型进行参数调整以达到该模型最优效果,再将训练集和验

证集数据所训练出的模型作为最终模型。最后用测试集对模

型效果进行评估,比较得到泛化误差最小的优化回归模型。为

了合理评估模型的泛化能力,选取更优的预测模型,选取拟合

优度(R2)、解释方差(Evar)、均方误差(MSE)、平均绝对误差

(MAE)四个评估指标对13种模型结果进行检验。检验效果如

表2所示。根据上述评估指标结果(表2),可以看出梯度提升回归

树(GBRT)模型相较于其他回归模型有较稳定的表现,预测

精度较好;而XGBoost、Bayesian

Ridge、ElastirNp|

.Bagging 等集

成学习回归模型效果也相对不错;剩余回归模型效果相对较XGBoost、ElasticNet、BayesianRidge、Bagging这四个模型的预

测稳定性相对较差,阶段性预测结果偏高或偏低情况明

显。五、基于GBRT模型疫情下我国GDP增速预测分析由上述分析得知,梯度提升回归树(GBRT)模型的预测效

果最好,接下来将主要采用该模型来估测未发生疫情情况下,

我国2020年第一季度至第三季度的GDP增速:(一)模型调参及解释运用梯度提升回归模型进行建模分析时.重点对模型参

数中的学习率(lfaming_rate )以及回归树数量(n_estimat

行调参。基于模型参数的特征,最终采取网格搜索的方法进行y_trUe与梯度提升决策树预测值比较201801 201802 201803 201804 2019Q1 2019Q2 2019Q3 201904、■^收与弹性网络预测值比较201801 201802 201803 201804 201901 2019Q2 201903 201904y_true与Bagging预测值比较201801 201802 201803 201804 201901 201902 201903 2019Q4图1五种回归模型GDP增速(%)预测值与实际值比较中国农业会计2021—3

EH

理讼蚵付表3特征向量IVATHTRDIELECEXPORTIM2CPI各特征向量的重要程度特征向量RPIIMPORTPPISCG(xRECI重要性比重0. 4430. 1260.0980.0760. 0570.0360.035重要性比重0. 0330.0310.0270.0150.0130. 0070.003TIXMA模型参数设定,以此得到最优模型参数由于特征向量中不同的变量对预测结果有着不同的影

响,遂通过GBRT1 莫型输出各解释变量对最终预测结果的重要

性比重。表3给出了各解释变量对于预测结果的重要程度排

序,其中丁业增加值同比增速、第三产业增加值同比增速、发

电量同比增速、出口额同比增速对于预测结果的贡献度最大,

这与实际情况比较符合:(二)预测结果分析GDP增速预测指标体系,择优选出梯度提升回归模型

(GBRT)对未发生疫情情况下2020年第一季度至第季度

GDP增速进行预测,并得出以下结论:一是在GDP增速预测

中,以梯度提升回归模型为代表的集成学习,比一般机器学

习具有更优良的泛化能力;二是丁.业增加值同比增速、第三

产业增加值同比增速、发电量同比增速、出口额当期同比增

速对GDP增速预测的贡献度相对较大;三是新冠疫情的暴发

导致我国2020年第一季度至第=季度GDP增速分别损失

13.51%、3.23%、1.56%。7654321*

-•- »»值6 46D------•验——主要参考文献[1] 陈林.重大突发公共卫生事件的经济影响及应对经

基于文献回頋视角[J].东北财经大学学报,2020(04):

20-29.[2] 周新辉,李昱喆,李富有.新冠疫情对中小服务型企业

基于回归算法优化模型的分析预测 影响评估及对策研究—[J].经济评论,2020(03): 101-117.[3]

响周梅芳,刘宇,张金珠,崔琦.新冠肺炎疫情的宏观经

济效应及其应对政策有效性研究[J].数量经济技术经济研

^,2020,37(08): 24-41.[4] 张文斗,祖正虎,许晴,徐致靖,刘巾杰,郑涛.突发大

图2 2020Q1-2020Q3未发生疫情下的预测值和发生疫

情后的真实值对比图规模疫情对经济的影响分析[J].军事医学,2014,38(02):

124-128.[5] 吴婷婷,朱昂序.新冠肺炎疫情对中国经济的影响及

由图2可以看出,未受疫情影响下,2020年一、二、三季度

GDP增速预测值分别为6.74% ,6.43%、6.46%。与发生疫情后

的GDP真实值对比发现,2020年第一季度GDP增速损失

13.51%,第二季度GDP增速损失3.23%,第三季度GDP增速损

应对策略[J].南方金融,2020(05):3.[6] 吴喜之.应用回归及分类—基于R[M].北京:中国人

失1.56%。结果表明,此次疫情对我国ODP增速带来短期巨大

冲击,但由于率先控制住疫情,且系列恢复经济的举措加快推

进.刺激消费的措施不断出台,我国GDP增速在第三季度达到较好效果民大学出版社,2016.[7] 肖争艳,刘玲君,赵廷蓉,陈彦斌•深度学习神经网络

能改进GDP的预测能力吗? [J].经济与管理研究,2020,41(07):3-17,六、结论为了定量估测新冠疫情对我国GDP增速的影响,构建了作者单位:重庆工商大学数学与统计学院

(责任编辑:帅 一)£3_中国农业会计2021—3


更多推荐

疫情,模型,增速,回归