相关系数模型_
第23卷第2期
科技通报
BULLETINOFSCIENCEANDTECHNOLOGY
Vol.23No.2Mar.2007
2007年3月
组合预测模型及应用
李
(南昌航空工业学院
曦
数学与信息科学学院,江西南昌330034)
摘要:通过主成分分析的方法,将非线性预测中的二次多项式预测、指数预测及灰色预测等3种不同
的预测方法组合在一起,提出了一种新的组合预测方法,并利用该方法对江西省的国民生产总值进行了预测。
关键词:灰色预测;非线性回归;组合预测;主成分分析中图分类号:O159
文献标识码:A
文章编号:1001-7119(2007)02-0159-04
TheApplicationofTheModelforCombinationForecasting
LIXi
(DepartmentofInformationandComputationalScience,NanchangInstituteofAeronauticalTechnology,
Nanchang,Jangxi,330034,China)
Abstract:Basedonthetwo-polynomialregressionforecasting,exponentregressionforecastingandgrayforcasting,anewkindofcombinationforecasting(method)ispresentbyapplyingthemethodofprincipalcomponentanalysis.TheGDPofJiangxiprovinceisforecastedbythismethod.
Keywords:grayforecasting;nonlinearityregression;combinationforecasting;principalcomponentanalysis
经济指标的准确预测是国家对宏观经济正确调控的必要前提,但经济系统是一个非常复杂的系非线性的、不确定性的作用关系;因此要准确地预测某一趋势,必须从多个方面统,其中存在着时变的、
进行考虑。预测方法多种多样,如线性与非线性回归预测模型,灰色系统GM(1,1)模型预测,马尔柯夫链预测模型,神经网络预测模型等等,每种预测各有其特点,在不同的方面有各自的优劣,因此为了准确地预测结果,可考虑采用组合预测法进行预测。组合预测模型的建立也有多种方法,如文[2]以误差绝对值的和为最小的标准建立的组合预测模型,文[3]的偏最小二乘法建立的组合预测模型;本文运用主成分分析的思想来建立组合预测模型,这一方法通过分析各种预测量间存在的起支配作用的本质特征及内部结构,找出了几种预测方法共同起作用的预测量,从而产生预测值。
1
组合预测模型的建立
假设对同一预测问题有m个预测模型,这m个预测模型预测值分别记为Y1,Y2,…,Ym,对各个不
收稿日期:2006-03-06作者简介:李
曦(1966-),男,江西进贤人,副教授,主要从事应用数学研究。
160
科技通报第23卷
同方法产生的Yi作为一个变量,对n个不同时间,计算出相应的预测值yij,(i=1,2,…,n;j=1,2,…,m),由此构造一个n×m矩阵,利用此矩阵求相关系数矩阵R=(rij),i,j=1,2,…
,m,其中n
y,
iji=1
n
rij=S,Sij=1! (yki-ikj-j…,m,
k=1
" iijj
对相关系数矩阵R计算其特征值,R的最大特征值记为λ1,把属于λ1的因子得分向量记为v1=(γ11,
2
,根据主成分思想,γγ12,…,γ1m)′1i是第i种预测对第一主成分的方差贡献率,贡献率越大,说明波动幅度
越大,那么在组合中所占的比例越多;否则,比例越少。因此,组合预测的比例可定为
22222
fi=γ1i/(γ11+γ12+…+γ1m)=γ1i(分母之和为1),i=1,2,…,m.
一般,若第一主成分的方差贡献率不足70%,可以考虑第二主成分,以第一、第二主成分的方差λ1和λ2
为权数,组合预测的比例可定为
22fi=(γ(i=1,2,…,m).1+γ2)/(λ1+λ2)1iλ2iλ
其组合预测模型为:
Y=f1Y1+f2Y2+…+fmYm
再利用该模型进行最后预测。
2
三种预测模型
下面我们选取江西省2000年至2004年的国内生产总值作为原始数据(见表1),分别采用三种模型进行预测。
表1
年份
2000~2004年江西省国内生产总值(亿元)TheGDPofJiangxiprovince2000-200420012175.68
20022450.48
20032830.46
20043495.94
Table1
20002003.07
GDP
2.1二次曲线预测GDP
从国内生产总值的散点图(图1)可以看出,GDP与时间呈非线性关系,可考虑用二次多项式进行非
线性回归,设Y1表示GDP的值,得二次曲线回归方程为:
Y1(t)=77.923t2-103.49t+2044.4
相关系数r=0.9973,对于n=5,α=0.01,查临界值为r0.01=0.9343,r>r0.01,故回归方程有效。
4000350030002500GDP
2000150010005000
2000
2001
图1
系列1
多项式(系列1)
(1)
200220032004
年份
GDP与时间的关系
Fig.1TherelationshipbetweenGDPandyears
第2期组合预测模型及应用
161
2.2用灰色系统GM(1,1)预测GDP
灰色系统是处理不完全信息的一种理论,灰色预测是指以GM(1,1)模型为基础的预测,其主要应用于时间序列预测,其方法是列出预测对象历史发展时间序列,并对其进行一次迭加得{X(t)},利用模型
dX+aX=b,得X(t)=(X(0)-b)e-at+b。根据前面列出的GDP数据得预测方程为:Y(t+1)=10063.07e0.2t×
21
(e0.2-1),由于观察到残差较大,故考虑用GM(1,1)模型进行残差修正,其残差序列e(t)生成的预测模型为:e(t+1)=594.72e0.4068t×(e0.4068-1),即修正后的预测模型为:
(2)Y2(t+1)=10063.07e0.2t×(e0.2-1)-δ(t-1)×594.72e0.4068t×(e0.4068-1)
1,t≥1
其中;δ(t-1)=
0,t<1
"
利用该模型进行预测可得预测值。
2.3指数曲线预测GDP
根据散点图,还可考虑用指数曲线进行回归预测:Y=atb,即lnY=lna+blnt,利用上述数据得lnY=
0.1377t+7.4265,R2=0.9704,即预测模型为:
Y3(t)=1679.9e0.1377t
相关系数r=0.985,说明效果较好。
(3)
3
组合预测模型
将三种预测方法预测结果汇聚成表2,将三种预测方法Yi(i=1,2,3)看作三个变量,
表2
3种预测方法的预测结果
Table2
年份
TheforecastingGDPbythreeforecastingmethod
Y22228.02272.82650.23048.03439.03774.0
Y31927.92212.52539.22914.03307.63837.9
Y42058.22211.42542.02946.434073946.8
Y2003.072175.682450.482830.463495.94
Y12018.82149.12436.22877.23475.04228.7
200020012002200320042005
求三个变量的相关系数矩阵R,其检验结果如下:
表3
KMO和Bartlett检验KMOandBartlett’sTest
0.77617.075
30.001
Table3
Kaiser-Meyer-OlkinMeasureofSamplingAdequacy.
Approx.Chi-Square
Bartlett’sTestofSphericity
dfSig.
进行KMO统计检验及Bartlet’S球形检验(表3):当KMO值越大,表示变量间的共同因素越多,越
适合进行因子分析,一般若其值小于0.5,则不适合进行因子分析,本结果显示为0.776,适合做因子分析;表中Bartlet’S为0.01,小于1%,同样说明变量间具有相关性,适合做因子分析。
计算R的特征值得:λ1=2.975,λ2=0.018,λ3=0.007,由于
162
科技通报第23卷
λ1
=2.975=0.9916
123
说明第一主成分达到99.16%,故只考虑第一主成分,其相应于λ1的因子得分向量为v′1=(0.335,
,将其单位化为v1=(,,)′,最后得到组合预测模型为:0.335,0.334)′
Y4=1(Y1+Y2+Y3)
(4)
由于本例中的特殊情况,使三种方法组合的结果恰好近似为三种方法的平均值,根据上述模型可预测
2005年江西国内生产总值为3946.8亿元;根据江西省2005年国民经济和社会发展统计公报,2005年江西省GDP为4056.2亿元,实际值与预测值很接近,由此看出组合预测效果更好。
参考文献:
[1][2][3][4][5]
庄楚强,吴亚森.应用数理统计基础(第二版)[M].广州:华南理工大学出版社,2003,12.马
骥,张卫峰.组合预测方法在磷肥需求预测中的应用[J].统计与决策,2005,(6):周爱民,基于偏最小二乘法的情报组合预测法[J].统计与决策,2004,176(8):江西省统计局编.江西统计年鉴2005[M].北京:中国统计出版社,2005.
杨明媚,李华林.主成分分析在证券组合投资中的应用[J].统计与信息论坛,2004,
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
(上接第158页)
1aδ>(1a21+1a23)(1a12δ2+4)≈3.989;14
1Sδ1a-1S]≈2.391当i=2,j=3时,[1R2+1S2-1a24δ4-22][a33-331
1aδ>(1a21+1a23)(1a32δ2+4)≈2.193;34
1Sδ1a-1S]≈6.432当i=4,j=1时,[1R4+1S4-1a42δ2-44][a11-113
1aδ>(1a41+1a43)(1a12δ2+4)≈4.987;14
1Sδ1a-1S]≈3.198当i=4,j=3时,[1R4+1S4-1a42δ2-44][a33-331
1aδ>(1a41+1a43)(1a32δ2+4)≈2.741.34
故A∈LDD(1,1,1),且由以上数据得Mi(α)>1,其中α=1.
可见,矩阵A满足定理1的条件(1),因此,A是非奇异H-矩阵.
参考文献:
[1][2][3][4][5][6][7]
王广彬,洪振杰.非奇异H-矩阵的充分条件[J].高等学校计算数学学报,2003.6,25(2):184-192.李继成,张文修.H矩阵的判定[J].高等学校计算数学学报,1999,21(3):264-268.孙玉祥.广义对角占优矩阵的充分条件[J].高等学校计算数学学报,1997,13(3):216-223.杨舒先.H-矩阵的判定方法[J].青岛大学学报,2003.6,16(3):17-21.
吕洪斌.矩阵的弱α-连对角占优性及应用[J].东北师大学报(自然科学版),2005,37(2):10-14.高益明.矩阵广义对角占优和非奇的判定[J].东北师大学报(自然科学版),1982,3:23-28.高
健,黄廷祝.广义对角占优矩阵的充分条件[J].电子科技大学学报,2004,33(2):208-210.