中国人均GDP的时间序列模型的建立与分析


笫34卷第6期

mm舢‰u咖w西est宅慧篡怒:曼。煞慧急蹦咖e洲。n

Dec.2008

文章编号:1003-2843(2008)06-1 162-06

中国人均GDP的时间序列模型的建立与分析
严天艳1‘3,吕王勇2j,朱丽萍3
(1.四川大学数学学院,四川成都610065;2.四Jll师范大学数学学院,四川成都610066; 3.攀枝花学院计算机学院,四川攀枝花617000) 摘要:人均GDP是人们了解和把握一个国家或地区宏观经济运行状况的有效工具.本文在介绍时间序列模型的基础上, 结合1952-2006年的中国人均GDP数据值,应用SPSS软件对数据进行了分析,建立了中国人均GDP的时间序列模型. 文章详细介绍了模型建立的整个过程,并由此模型对中国2007-2010年中国人均GDP的数值进行了预测.这对我们从宏 观上了解中国经济的发展状况,为国家制定科学合理的经济发展战略具有重要意义.

关键词:人均GDP;彳删(p,g);AmMA(p,d,g);白噪声序列
中图分类号:0211.9 文献标识码:A

人均GDP是体现一个国家经济实力、发展水平和生活水准的综合指标.它不仅考虑了经济总量的大小, 而且结合了人口多少的因素,在国际上被广泛用于评价和比较一个国家和地区经济发展水平.根据国家 统计局提供的数据显示,2000年中国人均GDP为7078元,按当年的汇率结算为856美元【11.如果2020年实现 翻两番,那么到时候人均GDP应该达至1J3500美元左右.世界银行发展指标数据库提供了2007年折算成美 元后中国人均GDP为2280美元.到底在过去的七年内中国人均GDP以比例计增长了多少,能否在2020年 实现比2000翻两番的预期目标,需要用一个时间序列的模型来分析预报.根据西方国家的经验,不同人均 GDP时期所面临的社会主要问题是不一样的.人均GDP的预报值不仅可以为国家领导人制定经济目标提 供依据而且还有利于国家采取正确的方针来应对人民收入水平逐渐升高带来的一系列社会问题.改革开 放三十年来中国经济保持了每年两位数的增长,在经济高速增长的同时到底人民口袋里的钱增长了多少. 在未来的几年内可能增长到什么数字,很值得去研究. 对于预测人均GDP有很多的方法,如回归预测法、时问序列分解法、趋势外推法、时间序列平滑预测法、 自适应过滤法等【2。81.相对于这些方法而言,时间序列模型预测法是一种精度相当高的短期预测法,而且是一种 从数据本身出发来寻找可以较好描述数据特征的方法.本文应用SPSS统计分析软件对1952年到2006年的中国人 均GDP时间序列数据进行了研究,并根据数据的特点构建了彳兄?=^翻时问序列预测模型.


时间序列分析方法简介

1.1

彳删模型是由AR(p)7阳MA(q)的有效组合和搭配的结果,它的基本思想是:将预测对象随时问推移而
我们把具有如下结构的模型称为自回归移动平均模型,简记为ARMA(p,q):

ARMA(p,g)模型141

形成的时间序列数据视为一个随机序列i用一定的数学模型来近似描述这个序列,这个模型一旦被识别后就可 以从时间序列数据的过去值及现在值来预测未来值。

收稿日期:2008.09.16

作者简介:严天艳(1969?),女,I囤)JI大学硕士生,攀枝花学院计算机学院副教授,主要从事概率与数理统计研究.

万方数据

第6期

严天艳等:中国人均GDP的时间序列模型的建立与分析

1163

f薯=矽o+≯l薯一l+≯2t一2+…+≯战一P+毛一目1E一。一82st一:一…一岛E1,
I矽P≠0,Oq≠0,

I E(6t)=o,Var(6t)=仃2f,E(616,)=o,S≠t,
l E(xstrt)=0,Vs<t.
若九=0,该模型称为中心化ARMA(p,g)模型.缺损默认条件,中心化ARMA(p,g)模型在平稳的时
间序列中它的一般形式可写为:

薯=矽l‘一l+≯2‘一2+…+矽磁一p+乞一秒lt一,一乡2t一:一…一秒gt一, ARMA(p,g)模型的_般形式表明时问序列数据薯既和滞后序列薯一,(i=1,2,…,p)有关,也和滞后序列
的误差q一,有关,毋是独立于誓一,和q一,的白噪声序列.在对原始数据平稳化处理后,可以通过分析数据的残

差序列,得到ARMA模型中的P和g的值以及模型中其它各个参数的值,其中P和q分别为偏自相关函数和
自相关函数显著不为零的最高阶数.
1.2

ARIMA(p,d,g)模型 求和自回归移动平均(autoregressive
integrated moving

average)模型,简记为ARIMA(p,d,g)模型.

ARIMA(p,d,g)模型是用于一个国家或地区经济和商业预测中比较先进适用的时间序列模型之一.它是一种 精度相当高的短期预测方法,而且它不需要事先假定数据存在着一定的结构或模式,而是从数据本身出发来寻 找可以较好描述数据的模式,从而可以保证模型与数据的拟合较好.它的结构为:

l O(B)V口■=O(B)8, {E(‘)=0,Var(s,)=盯占2,E(er占。)=0,s≠,

【Ex,q=o,VS<f
式中:Vd=(1一B)d,差分运算;

①(B)=1一≯lB…?一九Bp,为平稳可逆ARIMA(p,d,q)模型的自回归系数多项式; o(B)=1一qB…?一巳B。,为平稳可逆ARIMA(p,d,g)模型的移动平滑系数多项式;
B为延迟算子,B“X。=x卜。.

彳尺,M彳(P,d,g)模型的实质就是差分运算与ARMA(p,q)模型的组合.这一关系意义重大,这说明任
何非平稳序列只要通过适当阶数的差分实现差分后平稳,就可以对差分后序列进行ARMA模型拟合,而其中 d的取值就是差分的阶数.
1.3

ARIMA(p,d,q)模型具体建模步骤 1) 获得j!!Il察值序列.根据相关的数据资料和信息网站得到所要分析的数据.
2)

平稳性检验.通过时序图、自相关系数图检验判断序列的平稳性.

3)数据白噪声检验.利用QLB统计量检验.
4)

拟合ARMA模型.利用序列样本自相关函数图和偏自相关函数图结合ARMA模型的截尾性和拖尾性
特征初步确定模型的形式,由最小的Residual Variance对应的P,q值拟合模型,并估计参数.

5)
6)

残差序列白噪声检验.利用∞曰统计量检验残差序列是否是白噪声,若是白噪声,说明模型是有效的.
用所得模型进行预测.根据预测值了解序列发展的趋势,从而指导我们控制和决策.

2具体建立模型的过程

万方数据

1164

西南民族大学学报?自然科学版

第34卷

2.1数据准备

根据中国统计信息网得到了1978-2005年的中国人均GDP数据和2007年中国GDP总额(246619亿元)以及 2007年中国人口数(13.2129亿人).在(2006中国统计年鉴》中列出了1952.1977年和2006年的中国人均GDP数 据.即数据来源:中国国家统计局官方网站,{2006中国统计年鉴》.(计量单位:元)
2.2数据的平稳性检查

根据1952.2006年中国人均GDP时间序列数据资料,下面绘制中国人均GDP数据的时间序列图(见图1).从 图1可以看出,近55年来中国人均GDP呈现出明显的增长趋势,特别是在1992年以后呈现出强劲的增长势头.

1952.1977中国人均GDP年平均增长速度约为4.1%,1978--1991中国人均GDP年平均增长速度为12.1%,而
1992.2006中国人均GDP年平均增长速度为13.7%,呈加速增长趋势,从1952.2006年整个时期来看,人均GDP 呈现出指数增长趋势,具有明显的非平稳性.非平稳的数据是不能用来建立时间序列模型的,我们需要对数据 进行平稳化处理.
2.3数据平稳化处理

如果用非平稳序列来建立模型,就会出现虚假回归问题,,即尽管基本序列不存在任何关系,也会得到回归 模型.当随机变量不平稳时,统计量的拒绝域远远超过了检验的正常值,由按照一般的检验方法得出的接受假 设很可能是错误的.因此,要建立模型,随机序列必须是平稳的.对于含有指数趋势的时问序列,可以通过对序 列取对数来消除指数趋势.下面绘制取对数后的序列图(见图2).由图2知取对数后的数据仍然不平稳具有线性
趋势.

1952

1956

1蛳lqH脯8妁咒1976

l鲐l

1%5
l∞3

1909

19昭1∞7期1撕
IN
l神9

195.坤铺lg的19酌19阳1974

l孵8

H盯l帕l

a啪

图l

1952.2006年中国人均GDP时序图

图2经过自然对数变换后的序列图

对于有线性趋势的时间序列我们常常通过差分处理来消除数据的线性趋势.相距一期的两个序列值之问的 减法运算称为1阶差分运算.表达式为:Vxt=t—xf-1.依此类推,对P一1阶差分后序列再进行一次1阶差分 运算称为P阶差分.表达式为:VP一=VP-IX,一Vp-IXr-1.经过1阶差分处理后的数据在SPSS[5】中作图如图3. 根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在—个常数值附近随 机波动,而且波动的范围有界的特点.由图3显示经过处理后的数据值始终围绕在0.1附近随机波动没有明显的 趋势或则周期,基本可以视为平稳序列.为了稳妥起见,再利用了自相关图进一步辅助识别.如图4所示. 为了进一步的确定平稳性,我们考察差分后序列的自相关图(图4).自相关图显示随着延迟期数k的增加.平 稳序列的自相关系数衰减向o.序列具有较强的短期相关性,所以初步认为l阶差分后序列平稳.并且自相关图

具有拖尾性.为了更好的确定ARMA模型的参数再对数据用SPSS作出了差分后序列的偏自相关图(图5).

万方数据

第6期

严天艳等:中国人均GDP的时间序列模型的建,.0-4分析

1165

由图知偏自相关图jfl咱相关图一样都具有拖尾结构,我们初步估计应该建立ARMA模型.在建立模型前我 们还要做白噪声检验,以确定序列具有研究的价值

搦4

l嘲I撇l瞄1970

19M

l啪l啪IoA7

1991

l螨1999瑚3

图3一阶差分变换后的序列图 L稚c嘶.



Efr.?l。.75一.5?.25

9…,帮…矗
I?"????#?

j鸭,t

B—-Ljl珥prob;
12.883 lT.388 l

Fartial lbatocorreIaticml;,LII_I

D∞FF OJi,l,

Pr一觚一St-nd
L珥C“h
上 2

.479.j34

Err-以一.布一.5一.25口….蔬。i.75
f?“’.¨-?
?





.拍1

.1踅
.1 3I .130 .128



lⅢ?.? I“.
fI¨¨
I¨_^??

.47∥.13T .066.137 .137

3_.005 ● .106

T.3∞



18.0M
21.t<2
2s.155

J?
1??-..
l????. f??



3?.2lI 哇 B 6 7 .224 .220 .III

??#?I



6 f

.226
.336 .323




.i,7 .1研 .I翦
.137

.Jn
.1拍 .1H

?

。.

1?辩?-?
1?辑.

M.780
36.103 36.485



B ● lO

.143



.1舛

?

I??. ??l
-,

;078.123
。113 .12l

.,

卜?.
I?? I??


矗-:09l一.1翦
口 10

?



37.3H
38.109 38.6d8

,033.t3T
.139 :137



1?




12

.104.I∞
.087





i?".


.1墙 .1lT .1拍

.,
?

l??j
l?抖.

11一.126

.I孔
.13T

?抖?I
?

13
lt

.128
.068

39.803


12-oO如
13 .143

,?1



,,

I?
?1


40.15I 40.209

.1算 .1前

?

坫一.02'/".1M
16?.136 .“3

14一.077

?

l?¨。 ??I


.,



.轴?1
co叩m出h
fi-:ct

41.662
Stzrdard

咖潍鲫哪蛳咖 咖 咖啡咖 咖 咖

15一.178.13'/

Plot研岫ol私
:total

^mocorte]ztiora●’TWo

Err∞【jln‘

I丘一.I凹
Plot

.J珂

c"∞:蹦

l笔-:磁

S,曲ol,: T口td%‘H:鲥

.????1 .料叫 船toc靠r●lItio撼? ‰乳删dard&r缸Li^itt.


COIptltible

f扯lt

l■●:



图4一?阶差分变换后的自相关图

图5一阶差分变换后的偏自相关图

2.4白噪声检验

如果随机变量{五)满足如下性质: 1)任取f∈T,有E(x。)2“; 2)任取

加吨枷∽)书旭t=S,

则称序列{薯)为白噪声序列(、vhite noise),简记为薯~聊V(∥,仃2).从白噪声序列的定义知白噪声序列彼此之间 没有任何的关联,过去的行为对将来的发展没有任何的关系.当序列被确定为白噪声序列后,我们没必要再继

续研究下去.我们常用舛B统计量来检验序列是否为白噪声序列.用sPss算出的不同延迟期数的舛B统计量

万方数据

1166

西南民族大学学报?自然科学版

第34卷

Q(6)=28.155(o.ooo),Q(12)=38.648(0.ooo),Q(16)=41.662(0.ooo) 括号中的数为对应检验统计量的P值.由此知在检验的显著性水平为0.05的条件下,由于延迟6阶的卡方检 验统计量的尸值小于0.05,所以该差分序列不能视为白噪声序列,即差分后序列还蕴含着不容忽视的相关信息 可供提取,那么我们可以建立模型了. 2.5模型建立 在对以上的数据进行处理后,我们可以用SPSS软件对模型进行拟合以求得最优的模型.为了确定模型的 P,d,q值,表2给出了不同P,d,q时的Residual Variance值,满足Residual Variance最小的P,d,q值为我所求的 模型的参数.
表1
p。d,q Residual 0.00714 Variance p.d,q Residual 0.00680 0.00513 0.00625 0.00567 3,1,2 3,l,3 4,1,0 4,1,1 4,1,2 4,l,3 4,l,4 0.00692 0.00698 0.00693 0.00699 0.00085 0.00706 l,l,0 1,1,1 p

Z q对应的ResidualVariance值表
2,1,1 2,l,2 3,l,0 3,l,1

2,l,0

Variance

0.00577

0.00589

0.00650

由表1可知当P=3,d=1,q=3时,Residual Variance的值达到最小.此时模型为ARIMA(3,l,3),所拟合的 模型为:

只=1.35626y,一l一0.11179y,-2+0.13魄-3—0.37891只_4+q+O.253156t-l+0.058364—2一O.84924q一3

其中只一f=In(x/一。),f_0,1,2,3,4,五一。表示不I司年份的人均GDP.
2.6对拟合后的残差序列进行白噪声检验

对模型拟合后的残差序列用SPSS处理后得出的不同延迟期数QLB统计量为: Q(6)=5.469(0.485),Q(1 2)=6.74 1(0.874),Q(1 6)=7.904(0.952) 括号中的数为对应检验统计量的P值.由此知在检验的显著性水平为0.05的条件下,由于延迟6阶的卡方检验统 计量的尸值远远大于0.05,所以该差分序列是白噪声序列,即拟合后的残差序列不在蕴含信息可供提取.这个 序列值的变动是由于随机波动引起的. 为了验证模型的有效性用2000,2001,2002,2003年的数据来模挖J2004,2005,2006年的数据,得到如下的表:
表2模拟的数据和实际的数据比较表 年份 模拟的数据 实际的数据
2004 12268 12336 2005 14080 14040

计量单位:元
2006 16607 1593l

从以上的对比看拟合的效果好,没有出现太大的偏差,说明模型是有效的.


由所得的模型进行预测
表3中国人均GDP预测数据表 年份 中国人均GDP预测数据
2007 18538 2008 21195

计量单位:元
2009 2336l 2010 26467

4结论
根据中国统计告息网2007年中国GDP总额为246619亿元、人口为13.2129亿A得至1J2007年中国人均GDP为

万方数据

第6期


严天艳等:中国人均GDP的时间序列模型的建立与分析

1 167

8665元。从预测结果来看,2007年的预测值与实际值比较误差小,说明模型有较好的预测能力.从对以后三年 的预测值可以看到中国人均GDP有望在今后几年保持平稳高速增长.并且我们可以|乐观的估计在2020年中国人 均GDP可以达到甚至超过3500美元.尽管ARIMA模型在短期内预测比较准确,但随着预测期的延长,会出现 预测误差逐渐增大的情况,但是预测结果在一定程度上还是说明实现经济增长规划目标是完全可能的. 根据中国1952.2006年的人均GDP增长速度数据,我们不难看出,在1952.1978问由于历史的原因中国经 济始终在低位徘徊,增长速度缓慢.自1980年后中国经济出现了持续快速的增长.在实现人均GDP持续稳步增 长的同时,人均GDP增长速度出现了两个高峰期,分别为1992—1996年的13.7%增长速度和2000年以后的12% 的增长速度,由于1997年亚洲金融危机的影响放缓了中国经济的增长,从人均GDP上也可以体现出来.中国人 均GDP增长的另一特征是在一定时期增长高峰后随之而来的是增速递减,这种增速递减明显地说明一个具体 年份的经济增长是有增长极限的.如果这种增长速度过快,超过了社会、经济和自然资源的承受能力,短期的 高速度就要有更多年份白:低速度来弥补,若由于短期的高增长是以资源的过度投入和环境的破坏为代价,那么 它的长期成本要高于正常的均衡增长.由此说明,中国经济在高速增长的I司时还会遇到很多不确定因素,因此 不要一味地追求每年都达到较高的经济增长速度,而要综合考虑未来几年的发展环境,制定科学合理的经济发 展战略. 但是影响经济增长的因素很多包括外部的和内部的,并且这些因素中有相当一部分是不可控的,例如在未 来几年内出现大的自然灾害以及出现战争出现经济危机通货膨胀等特殊情况.而现实中已经发生的比如:从 2007年下半年起我国开始出现了通货膨胀的迹象对人均GDP的影响不小;由于投资市场的疯狂,从2007年起中 国实行了从紧的货币政策,一年之内数次提高存款准备金率,并且提高了股票交易中的印花税,降低了银行存 款中的税率等;2007年美国的次信贷危机殃及全球,引发了人们对未来几年内世界经济市场的担忧,甚至有人认 为世界经济增长会因此而放缓,势必会在一定程度上影响中国经济的增长. 做的这个预测只是在国际经济环境和中国内部的经济环境良好的前提下进行的,而这些经济目标只有在中 国经济持续、稳定、高速增长的情况下才能实现.
参考文献:
【l】林峰,葛新权.经济统计分析方法【M1.北京:社会科学文献出版社,2003. 【2】张守一,葛新权.中国宏:i见经济理论?模型?预湖41[MI.北京:社会科学文献出版社,1995. 【31王燕.应用He J’日I序列分析jM】.北京:中国人民大学出版社,2005. 【4】薛薇.统汁分析与SPSSflrJ应用【M】.北京:中国人民大学出版社,2001. 【51李朝鲜.社会经济统计学【M】.北京:经济科学出版社,2002. 【6】吴海军.ARIMA在北京市全社会同定资产投资预测中的应用【J】.经济研究导刊,2007,(2):131.133 【7】刘国光,王洛,李京文.2005年:中国经济形势分析与预ROIMI.北京:社会科学文献出版社,200. 【8l杜志渊.常用统计分析方法:SPSS应用[MI.济南:山东人民出版社,2006. Time series model’S constitution and analysis of per Chinese GDP
YAN Tian.Yanl’3,LU Wang.Yon92'3,ZHU Li.Pin93

(1.School ofComputer Science,Panzhihua University,Panzhihua617000,P.R.C.;2.School ofMathematics and Software,Sichuan
Normal University,Chcngdu 610066,P.R.C.;3.Department

ofMathematics,Sichuan University,Chengdu 610064,P.R.C.)

an efficient tool to know and hold macroscopically economics status of a country or area.Based introducing time series model,combined per Chinese GDP data from l 952 to 2006,the Paper applies SPSS to analyzing data and constituted time series model.The article particularly introduces whole process of constituting model and forecasts per

Abstract:Per person GDP iS
on

Chinese GDP data from 2007 institute scientific

to

2010.This has important meaning for

US

tO

know developing status of Chinese economy.to

and reasonable economic development strategy for

our

country. noise

Key words:per person

GDP;ARMA(p,g),ARIMA(p,d,q),white

万方数据


相关文档

四川省人均GDP时间序列模型的建立与分析
中国人均GDP时间序列建模与相关分析
中国人均GDP_1952_2002_时间序列分析
中国人均GDP的时间序列模型比较分析
我国GDP时间序列的模型建立与预测
人均GDP预测(时间序列模型)
基于时间序列模型的中国GDP增长预测分析
我国人均GDP时间序列模型及预测
人均GDP时间序列模型及预测
中国人均GDP19522002时间序列分析
基于时间序列模型的GDP预测(毕业论文)
人均GDP时间序列模型及预测
浙江省人均GDP时间序列模型的建立与预测
湖北省人均GDP时间序列模型及预测
我国人均GDP与消费的计量分析
电脑版